Biblioteka Narodowa informuje na swoich stronach internetowych, że razem z innymi 16 instytucjami, bierze udział w realizacji projektu Europeana Newspapers.
W ciągu najbliższych trzech lat instytucje te udostępnią za pośrednictwem serwisów internetowych portalu Europeana ponad 18 milionów stron gazet, głównie z pierwszego dwudziestolecia XX wieku.
Projekt Europeana Newspapers finansuje Komisja Europejska w ramach Programu Ramowego na rzecz Konkurencyjności i Innowacji 2007-2013 (CIP-ICT PSP), a jego celem jest agregacja wysokiej jakości cyfrowych kopii gazet za pośrednictwem The European Library.
Każda z bibliotek uczestniczących w projekcie udostępni za pośrednictwem portalu Europeana pełnotekstowe wersje zdigitalizowanych gazet. Celem projektu jest umożliwienie bezpośredniego dostępu do treści gazet za pomocą specjalistycznego interfejsu portalu Europeana, pozwalającego na wyszukiwanie całych fraz lub poszczególnych słów w zdigitalitowanym tekście.
Projekt dotyczy przede wszystkim udoskonalenia metod Optycznego Rozpoznawania Pisma (OCR — Optical Character Recognition), segmentacji artykułów i Optycznego Rozpoznawania Układu Strony (OLR — Optical Layout Recognition), rozpoznawania nazw (NER — Name Entity Recognition) oraz rozpoznawania typu strony.
Projekt koordynuje Biblioteka Państwowa w Berlinie. Partnerzy projektu
Europeana to wielojęzyczna wirtualna kolekcja, obejmująca miliony zdigitalizowanych obiektów z europejskich muzeów, bibliotek, archiwów i zbiorów audiowizualnych. Dziś Europeana umożliwia zintegrowany dostęp do ponad 23 milionów książek, filmów, obrazów, eksponatów muzealnych i archiwalnych dokumentów z ponad 2200 kolekcji w całej Europie.