Kranten (1875-1885)

Speciaal voor de Hack-a-LOD hebben we een klein deel van de metadata van de Delpher kranten-dataset omgezet in RDF en beschikbaar gemaakt in de KB Dataspace.  Deze krantendataset (CC-BY) bevat een deelselectie (1865-1875) van de gedigitaliseerde historische kranten op Delpher, de nationale samenwerking tussen diverse erfgoedinstellingen en bibliotheken. De totale Delpher collectie bevat ongeveer 11 miljoen krantenpagina’s uit Nederland, Nederlands-Indië, de Antillen, Amerika en Suriname van 1618 tot 1995. Dit is zo’n 15% van alle kranten die ooit in Nederland zijn gepubliceerd.

In het overzicht van beschikbare titels en jaargangen (PDF) ziet u welke kranten er op dit moment beschikbaar zijn in Delpher. Dit is een ruw overzicht omdat alleen de eerste en laatste jaargang genoemd worden. De tussenliggende (delen van) jaargangen kunnen ontbreken. Als u precies wilt weten welke kranten er wel en niet in Delpher zitten, ga dan naar het krantenoverzicht.

Let wel, deze dataset ‘Kranten (1875-1885) is speciaal gemaakt voor ontwikkelaars om mee te werken tijdens de Hack-a-LOD. De dataset kan daarom nog enige fouten bevatten die we uiteraard graag verbeteren. Daarnaast kunnen we niet garanderen dat deze dataset in de huidige vorm ook nog beschikbaar is over een aantal jaren.

 

Bestanden

De volgende bestanden zijn beschikbaar:

  • Hi-res opname van het originele typoscript (JPG-formaat)
  • Full-textbestand verkregen via automatische OCR. Hier zitten fouten in die niet gecorrigeerd zijn.
  • Bestand met de coördinaten van elk woord van het typoscript (ALTO) in XML)
  • Metadata (MPEG21-DIDL) voor de beschrijving van het typoscript en om de samenhang van bestanden 1, 2 en 3 weer te geven.

 

RDF Bestanden in KB Dataspace

De kranten dataset is geladen in de triplestore van de KB Dataspace, omvat ruim 14 miljoen triples en bestaat uit de volgende entiteiten: 12 verschillende collecties met daarin 29670 kranten uitgegeven in de periode 1865-1875. In de kranten zijn 914136 artikelen beschreven. Deze kranten zijn uitgegeven door 48 verschillende uitgevers in 55 verschillende periodieken of koepeltitels en 7 verschillende verspreidingsgebieden. De pagina’s bevatten links naar een afbeelding van de gescande pagina van de oorspronkelijke krant, en de artikelen bevatten links naar OCR resultaten van het artikel, ofwel de automatisch herkende tekst van een artikel.

kranten