Artykuły ILS

Recent Submissions

Displaying 1 - 3 of 3 records
  • Item
    Polskojęzyczne korpusy równoległe w Polsce i za granicą
    (Instytut Lingwistyki Stosowanej UW, 2016) Leńko-Szymańska, Agnieszka; Gruszczyńska, Ewa; Uniwersytet Warszawski
    Na tom składają się artykuły opisujące projekty, które już zostały zakończone, a także takie, które są na etapie realizacji. W każdym rozdziale można znaleźć szczegółowy opis konkretnego korpusu równoległego zawierającego polski komponent. Prezentowane i poddane dyskusji są zarówno budowa korpusu, anotacja oraz zastosowany interfejs. Autorzy dostarczają także wielu przykładów badań opartych na danych uzyskanych z korpusów równoległych lub badań, które są planowane. Badania te potwierdzają wielość zastosowań cyfrowych zasobów paralelnych w językoznawstwie oraz kulturoznawstwie.
  • Item
    InterCorp – a look behind the façade of a parallel corpus
    (Instytut Lingwistyki Stosowanej UW, 2016) Rosen, Alexandr; Univerzita Karlova
    InterCorp to projekt, który powstał na Wydziale Filozoficznym Uniwersytetu Karola w Pradze. Jego celem jest zbudowanie obszernego równoległego korpusu synchronicznego, który obejmowałby jak najwięcej języków. W tworzeniu korpusu uczestniczą pracownicy naukowi i studenci Wydziału Filozoficznego Uniwersytetu Karola, osoby związane z Czeskim Korpusem Narodowym, a także współpracownicy zewnętrzni. InterCorp to rzeczywiście obszerny i ciągle rozwijający się synchroniczny korpus równoległy, obejmujący teksty w języku czeskim i 38 innych językach – w tym w języku polskim (wersja 8; stan w lutym 2016), dostępny online poprzez interfejs. Trzon korpusu, który stanowi półautomatycznie opracowana beletrystyka, jest uzupełniony automatycznie opracowanymi tekstami z zakresu publicystyki i prawa, a także zapisami debat parlamentarnych i napisami filmowymi. W sumie korpus obejmuje około 1,6 miliarda słów. Wszystkie teksty dysponują wiązaniem segmentów na poziomie zdania i w miarę możliwości są opatrzone lingwistyczną anotacją (z podaniem podstawowych form i kategorii morfologicznych) oraz danymi bibliograficznymi. Po krótkiej prezentacji koncepcji korpusu przedstawiamy jego parametry liczbowe; zwracamy przy tym uwagę na olbrzymią nierównowagę w reprezentacji tekstów z różnych języków, oryginałów i przekładów oraz typów tekstów. Staramy się także dokonać porównania z niektórymi innymi projektami tego typu. W części poświęconej wykorzystaniu korpusu zwracamy uwagę na możliwości i ograniczenia wyszukiwarki KonText (wcześniej wykorzystywane wyszukiwarki Bonito i NoSketch Engine nie są już dostępne) oraz różne sposoby wykorzystania tekstów równoległych takich jak ekscerpcja ekwiwalentów leksykalnych czy analiza zgodnych fragmentów tekstu. Spojrzenie na korpus od strony użytkownika jest uzupełnione komentarzem twórców korpusu. W części przedstawiającej opracowywanie tekstów przed ich włączeniem do korpusu oczekiwania i życzenia użytkowników zostają skonfrontowane z koncepcyjnymi, technicznymi i fizycznymi możliwościami budowy korpusu paralelnego. Końcowa część 22 Alexandr Rosen zawiera wnioski, jakie się nasuwają na podstawie dotychczasowych doświadczeń, a także plany na przyszłość obejmujące zarówno konkretne projekty twórców korpusu, jak i koncepcje dotyczące zmian wymagających dużych technicznych interwencji w samej strukturze korpusu. Powstały i ciągle rozwijany korpus równoległy InterCorp ma z założenia służyć między innymi jako źródło danych do badań teoretycznych, analiz gramatycznych i leksykograficznych, prac translatorskich, projektów dotyczących nauki języków obcych, a także jako materiał do badań dla studentów.
  • Item
    The Effects of Shot Changes on Eye Movements in Subtitling
    (International Group for Eye Movement Research, 2013) Krejtz, Izabela; Szarkowska, Agnieszka; Krejtz, Krzysztof; University of Social Sciences and Humanities; University of Warsaw
    In this paper we address the question whether shot changes trigger the re-reading of subtitles. Although it has been accepted in the professional literature on subtitling that subtitles should not be displayed over shot changes as they induce subtitle re-reading, support for this claim in eye movement studies is difficult to find. In this study we examined eye movement patterns of 71 participants watching news and documentary clips. We analysed subject hit count, number of fixations, first fixation duration, fixation time percent and transition matrix before, during and after shot changes in subtitles displayed over a shot change. Results of our study show that most viewers do not re-read subtitles crossing shot changes.