Over deze site

Workflow

De Koninklijke Bibliotheek werkt bij massa (tekst)digitaliseringsprojecten volgens een gestandaardiseerd proces (de workflow). De workflow bestaat uit een aantal onderdelen:

  1. Voorbewerking en materiaalanalyse; voorbereiding en analyse van het materiaal voor digitalisering.
  2. Productie content; vervaardigen van het gedigitaliseerde materiaal (de content).
  3. Verwerking en opslag; controles en conversies van het gedigitaliseerde materiaal, plus opslag in diverse opslagomgevingen.
  4. Ontsluiting; indexering van het tekstmateriaal en de metagegevens en de toepassing van verschillende technieken om het materiaal te ontsluiten.
  5. Beschikbaarstelling; publicatie van de digitale bestanden op een website.

Het krantenproject is één van de grootste digitaliseringsprojecten van historisch materiaal in Nederland. In een periode van vier jaar worden gemiddeld 200.000 pagina's per maand geselecteerd, voorbewerkt, gedigitaliseerd, verwerkt, opgeslagen en gepubliceerd. Voor de opslag van acht miljoen pagina's is 250 terabyte aan opslagruimte nodig. Eén van de grootste uitdagingen van het project is de inrichting van een efficiënte workflow waarin deze capaciteit bereikt kan worden. Dit geldt zowel voor de workflow binnen de Koninklijke Bibliotheek als bij de leverancier van de digitale content. Uit het marktonderzoek dat in mei-juni 2007 is uitgevoerd, blijkt dat slechts enkele leveranciers ervaring hebben met het digitaliseren van deze aantallen.

De digitalisering is uitbesteed door middel van een Europese aanbesteding. Ter voorbereiding van de aanbesteding is in mei 2007 een marktonderzoek gedaan, waaraan veertien bedrijven hun medewerking verleenden. De bevindingen van het marktonderzoek zijn verwerkt in de specificaties voor de aanbesteding. In 2008 is gestart met digitalisering van de eerste dagbladen.