Data

De Hack-a-LOD draait om het koppelen van digitale collecties van erfgoedinstellingen. Hiervoor kun je je eigen collectie(s) gebruiken maar om het je wat makkelijker te maken, hebben we speciaal voor de Hack-a-LOD alvast een groot aantal datasets verzameld en geschikt gemaakt om elkaar te koppelen.  Onder het tabblad ‘Datasets’ vind je aparte pagina’s met informatie over elke dataset: wat zit er in? Hoe kun je ze benaderen? Wat hebben andere er al eens mee gedaan?

We hebben hard gewerkt om de data zoveel mogelijk toegankelijk te maken in RDF via een SPARQL Endpoint in de KB Dataspace, zie alle info daarover hieronder. Data die vanwege technische of andere redenen niet in RDF beschikbaar gemaakt kan worden, is beschikbaar via OAI, SRU of een specifieke API.

In onderstaande tabel zie je alle beschikbare datasets en de bijbehorende URI. Elke URI die begint met http://lod.kb.nl is onderdeel van de KB Dataspace. Wanneer je klikt op de naam van een dataset kom je op een aparte pagina met meer informatie over de betreffende dataset.

ANP radiobulletins http://lod.kb.nl/anp/
Early Dutch Books Online http://lod.kb.nl/edbo/
Erfgoedthesaurus RCE http://lod.kb.nl/erfgoedthesaurus/
Geheugen van Nederlands – KIT Koloniale Wereldtentoonstellingen http://lod.kb.nl/kit01/
Geheugen van Nederland – KITLV Nederlands-Indië in foto’s, 1860-1940 http://lod.kb.nl/kitlv/
Geheugen van Nederland – Collectie Natuurkundige Commissie voor Nederlands-Indië http://lod.kb.nl/nat01/
GGC Thesauri
G!Ds Bibliotheken http://lod.kb.nl/gids/
Iconclass
Kranten (1875 – 1885) http://lod.kb.nl/kranten/
Middeleeuwse Verluchte Handschriften http://lod.kb.nl/byvanck/
Nationaal Archief – Raad van State: Naamindex op de commissieboeken http://na.metamatter.nl/NadereToegang/Commissieboeken/CommissieLijst
Nationaal Archief – Centrale Commissie voor de Filmkeuring: filmrapporten http://na.metamatter.nl/NadereToegang/Filmkeuring/KeuringsrapportenLijst
Nationaal Archief – Bewindslieden: Archieven van ministers en staatssecretarissen http://na.metamatter.nl/NadereToegang/Bewindslieden/BewindsliedenLijst
Nationale Bibliotheek Catalogus NBC+ http://lod.kb.nl/nbc/
Oorlogsbronnen – Beeldbank WOII http://lod.kb.nl/bbwo2/
Oorlogsbronnen – DANS Collectie http://lod.kb.nl/dans/
Oorlogsbronnen – Gemeentearchief Zaanstad http://lod.kb.nl/gaz/
rijksmonumenten.info http://lod.kb.nl/rce/
Staten Generaal Digitaal http://lod.kb.nl/sgd/
STCN http://data.kb.nl/stcn
KB Code http://lod.kb.nl/hss/
http://lod.kb.nl/kbcode/
Watermarks in Incunabula printed in the Low Countries
KB Dataservices en API’s

Daarnaast zijn er online natuurlijk nog veel meer datasets gevonden. Een aantal vind je op de pagina ‘Tips voor andere Datasets‘.

 

KB Dataspace

Speciaal voor deelnemers aan de hackathon stellen wij de KB Dataspace beschikbaar. De KB Dataspace is een online platform waarin RDF data als Linked (Open) Data wordt aangeboden op het Internet. Door data als RDF te organiseren wordt optimaal gebruik gemaakt van de mogelijkheden om verbindingen, of ‘links’, tussen verschillende datasets te definiëren. Dit biedt mogelijkheden om verschillende interne datasets te verenigen waardoor overzicht wordt verkregen, en redundantie wordt gereduceerd. Daarnaast bieden links mogelijkheden om data te verrijken met aanvullende informatie uit (externe) datasets. Voor de KB Dataspace zijn verschillende datasets geconverteerd naar RDF en voorzien van aanvullende links en informatie. In het schema hieronder staat een weergave van de datasets die in de KB Dataspace zijn geladen. Meer informatie over elke afzonderlijke dataset vind je op de aparte pagina’s per dataset.

SchemaKBDataspace2

 

Bovengenoemde datasets zijn ‘gelinkt’ met elkaar, enerzijds op basis van bestaande informatie binnen de datasets, zoals b.v.b. thesaurus informatie met NBC titels. Anderzijds zijn links gezocht met externe bronnen zoals DBpedia/Wikipedia, Wikidata en VIAF. Hieronder een opsomming van de verschillende ‘link jobs’ die zijn uitgevoerd om links met externe bronnen te vinden:

dataset 1 dataset 2 link aantal links
1 NTA (PPN nr.) VIAF owl:sameAs 1467773
2 NTA (VIAF nr.) Wikidata owl:sameAs 96852
3 NTA (VIAF nr.) DBpedia Duits owl:sameAs 40114
4 NTA (VIAF nr.) DBpedia Engels owl:sameAs 37695
5.1 NTA (VIAF nr.) DBpedia NL owl:sameAs 3577
5.2 NTA (Labels) DBpedia NL skos:exactMatch 13928
6 NBC (OCLC nr.) WorldCat owl:sameAs 5318854
7 NBC (Ebook labels) Gutenberg owl:sameAs 43601
8 NBC Brinkman DBpedia NL owl:sameAs 10217
9 NBC GTT DBpedia NL owl:sameAs 29177
10 NBC Brinkman NBC GTT owl:sameAs 6284
11 NBC Corporaties DBpedia NL owl:sameAs 10067
12 NTA (label) DBNL rdfs:seeAlso 1136
13 NBC Corporaties NBC GTT owl:sameAs 2164

 

Sparql Endpoint

De KB Dataspace bestaat uit diverse services ter ondersteuning van het gebruik en beheer van LOD. Voor de hackathon is de Sparql Endpoint de belangrijkste. Linked Open Data (LOD) is er om gezien te worden, door gebruikers, via het Internet. Daarvoor zijn toepassingen nodig die data ontsluiten. De meest voor de hand liggende is een algemene zoekfunctie. Maar er zijn vele alternatieve interfaces denkbaar die LOD ontsluiten aan eindgebruikers. Elementair voor het ontsluiten van LOD is een SPARQL interface waar applicaties gebruik van kunnen maken. Het is aan de creativiteit van ontwikkelaars om innovatieve interfaces te ontwikkelen voor LOD.

Voorbeeld Interface:

Algemene zoekingang: http://lod.kb.nl/fct  

Grafische zoek/ontdek ingang: http://lod.kb.nl/LodLive/?http://lod.kb.nl/ppn/067751482

 

Hoe gebruik je een Sparql Endpoint?

Als je meer wilt weten hoe Sparql werkt dan bevelen wij van harte de online tutorial aan bij de Programming Historian: http://programminghistorian.org/lessons/graph-databases-and-SPARQL Hierin wordt niet alleen duidelijk uitgelegd wat RDF precies is en wat je ermee kunt, maar ook hoe je Sparql queries kunt formuleren en hoe je de resultaten kunt analyseren.

Een andere uitgebreide toelichting op Sparql vind je op https://en.wikibooks.org/wiki/XQuery/SPARQL_Tutorial