The Polish-Swedish and Swedish-Polish Parallel Corpus for exploring language contacts through translation

Abstract
Artykuł ma na celu zaprezentowanie prac związanych z powstawaniem korpusu równoległego współczesnych polskich i szwedzkich tekstów literackich. Przedstawia także wyniki badania pilotażowego porównującego za pomocą danych równoległych językowe wykładniki emocji w obu językach i ich wzajemnych tłumaczeniach. Polsko-szwedzki i szwedzko-polski korpus równoległy powstaje w Pracowni Badań Skandynawistycznych na Wydziale Lingwistyki Stosowanej Uniwersytetu Warszawskiego. Planowany jest na około 10 milionów tokenów i wykorzystywany będzie w badaniach dotyczących powiązań językowych w tłumaczeniach oraz wpływu przetłumaczonych tekstów na wzajemne postrzeganie języków i kultur. Zawierać będzie polskie i szwedzkie teksty literackie opublikowane w obu językach w ostatnich 20 latach waz z ich tłumaczeniami na oba języki. Wersja pilotażowa korpusu liczy obecnie około 750 000 wyrazów i obejmuje trzy współczesne szwedzkie powieści przetłumaczone na język polski oraz jedną powieść i 14 opowiadań w języku polskim wraz z ich szwedzkimi przekładami. Minikorpus został zrównoleglony na poziomie zdań przy użyciu pakietu LFAligner 4.0, a jego polska część została otagowana przez Treetagger. Interfejs został oparty na pakiecie ParaVoz, oryginalnie stworzonym dla projektu ParaSol. Badanie pilotażowe z wykorzystaniem minikorpusu osadzone zostało w teorii wymiaru kultur, której autorem jest Geert Hofstede. Przeprowadzono je pod kątem sposobu tłumaczenia na oba języki wybranych jednostek leksykalnych związanych z emocjami z pola semantycznego polskiego rzeczownika strach oraz szwedzkiego skräck. Wyrazy odnoszące się w obu językach do tej emocji zostały uszeregowane pod względem intensywności. Następnie rzeczowniki w języku polskim zostały zestawione z ich szwedzkimi ekwiwalentami tłumaczeniowymi występującymi w korpusie i porównane pod względem mocy. Ta sama procedura została zastosowana dla rzeczowników polskich i ich szwedzkich odpowiedników. Wydaje się, że wyniki badania, które ze względu na niewielką objętość korpusu należy traktować bardzo ostrożnie, potwierdzają hipotezę, według której różnice w emocjonalności wyrażanej językowo po polsku i po szwedzku mają odzwierciedlenie w przekładach. Kultura szwedzka charakteryzuje się słabszym i bardziej stonowanym sposobem wyrażania emocji w porównaniu z kulturą polską. Tłumacze polscy wybierają zazwyczaj ekwiwalenty, które (biorąc pod uwagę parametr intensywności) są silniejsze od jednostek językowych użytych w szwedzkim oryginale. Widoczna jest także odwrotna tendencja w tłumaczeniach z języka polskiego na język szwedzki. Oznacza to, że oprócz innych wymiarów wskazanych przez Geerta Hofsteadego, kultura polska i szwedzka różnią się także pod względem emocjonalności. Jednak, aby potwierdzić wiarygodność wstępnych wyników, badania zostaną powtórzone na dużym korpusie docelowym.
Description
Gruszczyńska, Ewa; Leńko-Szymańska, Agnieszka, red. (2016). Polskojęzyczne korpusy równoległe. Polish-language Parallel Corpora. Warszawa: Instytut Lingwistyki Stosowanej, pp. 250-267.
Keywords
Citation
Belongs to collection