Collectie: ANP Radio bulletins 1937-1984

Collectie: ANP Radio bulletins 1937-1984

Wie & Wat

Wie herinnert zich niet de ‘radionieuwsdienst verzorgd door het ANP’ die decennialang te horen was op de radio? Sinds zijn bestaan vanaf 1934 heeft het ANP een eigen tekstarchief opgebouwd.

Fig. 1. ANP Nieuwsbericht – 30-10-1966 – 14, CC BY-NC-ND

Het begon met tekstvellen met nieuwsberichten geschreven door journalisten. Een paar jaar later, vanaf 1937, was het nieuws ook via de radio te beluisteren. Het ANP-archief werd uitgebreid met uitgetypte teksten (typoscripten) van radiobulletins en geluidsbanden van radio-uitzendingen van de Radionieuwsdienst ANP. De tekstberichten en radiobulletins beslaan een belangrijk deel van de recente geschiedenis van Nederland, en het Nederlandse perspectief op het wereldgebeuren.

De open dataset ANP Radiobulletins Digitaal bevat 1,5 miljoen gedigitaliseerde typoscripten van nieuwsuitzendingen uit het midden van de 20e eeuw (1937 – 1984). De set biedt het nieuws van elke dag, zoals het werd voorgelezen op de radio. 

 

Mogelijke toepassingen

PoliMedia  is een zoekmachine die bronnen tussen 1945-1955 indexeert, waaronder de ANP radiobulletins, kranten, en parlementaire handelingen. DIVE heeft Bulletin data gebruikt om historische gebeurtenissen te ontdekkenDelpher is een tool die tevens gebruik maakt van deze data.

De Radiobulletins zijn een interessante bron om historisch wereldnieuws te analyseren en te gebruiken om een wereld events model met keywords te maken. Echter de kwaliteit van de metadata laat te wensen over vanwege problemen met de OCR.

 

Hoe te gebruiken
Voor elk van de typoscripten zijn er verschillende bestanden beschikbaar. Het overzicht hiervan wordt geboden vanuit het SPARQL Endpoint lod.kb.nl in de graph http://lod.kb.nl/anp/
De metadata  (link):

select * where {
$s <http://purl.org/dc/elements/1.1/identifier> $id .
OPTIONAL { $s <http://www.w3.org/2000/01/rdf-schema#label> $label .}
OPTIONAL { $s <http://xmlns.com/foaf/depiction> $depiction .}
OPTIONAL { $s <http://data.kb.nl/ontology/berichtNummer> $bnum .}
OPTIONAL { $s <http://purl.org/dc/terms/date> $date .}
OPTIONAL { $s <http://purl.org/dc/terms/isPartOf> $partof .}
OPTIONAL { $s <http://purl.org/dc/terms/source> $source .}
OPTIONAL { $s <http://lod.kb.nl/ontology/didl/ocr> $didl .}
} limit 100

Depiction is een  Hi-res opname van het originele typoscript (JPG-formaat, 1 TB, CC BY-NC-ND). 

 

Source beschrijft in DIDL-formaat, CC BY-NC-ND de tekst die via OCR is verkregen. DIDL ziet er zo uit:

text>
<p>Red.</p>
<p>mallon</p>
<p>Datum:</p>
<p>6-2-51</p>
<p>Tijd:</p>
<p>Onderwerp:</p>
<p>Urban!</p>
<p>ƒ</p>
<p>
&HX& tmi& KaHmKmxmyaxmHgxhxmf& x8HmHmxaimHmhmH& xhHmHBmAx& H& xm
</p>
<p>*</p>
<p>
BhBfxnamxAHmxÈKRxnxmxAzmx& Hmkmxm De regering van Italie heeft generaal Ur$ani benoemd tot stafchef van de Italiaanse l& chtmacht/
</p>
<p>
Hij komt in de plaats van generaal Cat/die j& ihbaftiajgfaH&' anE
</p>
<p>Bron:</p>
<p>r%r</p>
<p>Regels: 3</p>
</text>

De individuele OCR kwaliteit biedt op individueel niveau beperkte mogelijkheden. Meer mogelijkheden zijn er met het benutten van de data op macro niveau. Denk bijvoorbeeld aan visualisaties van topics door de jaren heen. Voor meer data en digitale collecties, zie het data overzicht.

De ANP Nieuwsbulletins zijn opgenomen in de KB Dataspace, zie informatie daarover  op de KB data-pagina.

Back to site top