Gromadzenie, udostępnianie i wolna dystrybucja metadanych. BazHum — nowe podejście

Baza bibliograficzna Bazhum rejestruje informacje o zawartości bibliograficznej czasopism z dziedzin nauk humanistycznych i społecznych w pełnym zakresie - od początkowych do ostatnich numerów (obecnie 270 czasopism, ponad 310 tysięcy rekordów). Dane cechują wysoka jakość, otwartość i interoperacyjność. Wszystkie dane bibliograficzne dostępne są na wolnej licencji ODbL - mogą być przetwarzane i umieszczane w innych bazach, w tym również w polskim systemie do parametryzacji jednostek naukowych POL-on oraz Polskiej Bibliografii Naukowej. Ten potencjał został wykorzystany przez serwis (uruchomiony w kwietniu 2013 roku, dostępny na wolnej licencji GNU General Public License). Umożliwia on przeglądanie, przeszukiwanie oraz masowy eksport danych. Obok bazy bibliograficznej postępuje rozwój kolekcji pełnotekstowej (obecnie 21 tysięcy artykułów bieżących lub archiwalnych). Starsze teksty są opracowywane i digitalizowane na koszt projektu. Trwają rozmowy z wydawnictwami.

BazHum is a bibliographic database that provides bibliographic records of the whole content of 270 journals from humanities and humanistic social studies (from the first to the last/current issue of each title). The database gives access to more than 310 thousands records. Chief characteristics of the records in BazHum are their high quality, openness, and interoperability. All bibliographic records are under the Open Database License (ODbL). The data can be freely shared, modified, and used, also in a system of parameterization for research units, POL-on, and Polish Scholarly Bibliography (PBN). In order to use the full potential of the open data, in April, 2013, the metadata service [] was launched. Apart from browsing and searching through the metadata, the main functionality of the service is a mass export of the data. The service is published under the GNU General Public License. Simultaneously to the work on the bibliographic database, a full text database for BazHum is being created. Some 21 thousands complete texts are ready to be presented, both from archive, and current issues. The former are digitized and processed (image processing and OCR), so as to be fully searchable. The cost of the process is included in general cost of the project. The BazHum project’s aim is the development of the full text database through negotiations with publishers and authors, and digitization.