Pokaż uproszczony rekord

dc.contributor.authorTkaczyk, Dominika
dc.contributor.authorBolikowski, Łukasz
dc.contributor.authorCzeczko, Artur
dc.contributor.authorRusek, Krzysztof
dc.date.accessioned2013-06-26T09:51:54Z
dc.date.available2013-06-26T09:51:54Z
dc.date.issued2012-03-27
dc.identifier.other10.1109/DAS.2012.4
dc.identifier.urihttp://depot.ceon.pl/handle/123456789/1972
dc.description.abstractWe present a comprehensive system for extracting metadata from scholarly articles. In our approach the entire document is inspected, including headers and footers of all the pages as well as bibliographic references. The system is based on a modular workflow which allows for evaluation, unit testing and replacement of individual components. The workflow is optimized towards processing of born-digital documents, but may accept scanned document images as well. The machinelearning approaches we have chosen for solving individual tasks increase the ability to adapt to new document layouts and formats. The evaluation tests we have performed showed good results of the individual implementations and the entire metadata extraction process.en
dc.language.isoenen
dc.rightsDozwolony użytek
dc.subjectbibliographic reference parsingen
dc.subjectcontent classificationen
dc.subjectpage segmentationen
dc.subjectmetadata extractionen
dc.titleA modular metadata extraction system for born-digital articlesen
dc.typeinfo:eu-repo/semantics/conferenceObjecten
dc.contributor.organizationInterdyscyplinarne Centrum Modelowania Matematycznego i Komputerowego, Uniwersytet Warszawskien
dc.description.epersonMichał Łopuszyński


Pliki tej pozycji

Thumbnail

Pozycja umieszczona jest w następujących kolekcjach

Pokaż uproszczony rekord

Dozwolony użytek
Korzystanie z tego materiału jest możliwe zgodnie z właściwymi przepisami o dozwolonym użytku lub o innych wyjątkach przewidzianych w przepisach prawa, a korzystanie w szerszym zakresie wymaga uzyskania zgody uprawnionego.