GeoDataWizard

GeoDataWizard

De GeoDataWizard is een uitbreiding op de eerste versie van de LD Wizard. LD Wizard is een open source project, geinitieerd door het Netwerk Digitaal Erfgoed, waarmee kleine tabulaire datasets (CSV bestanden) kunnen worden getransformeerd tot Linked Data. De uitbreiding, door Kadaster geinitieerd, zorgt ervoor dat geografisch gerelateerde elementen in de dataset, zoals een coordinaat of een adres ook als correcte Geo Linked Data wordt getransformeerd. Deze uitbreiding is ook als open source software beschikbaar, en wordt op termijn ook terug gebracht naar de broncode van de LD Wizard.

De GeoDataWizard is een data transformatie tool, en geen data cleaning tool. Het is dan ook verstandig om de data eerst te cleanen (denk aan hoofdletter gebruik, lege waardes, etc). Voor de geo elementen is het ook belangrijk dat de adressen, woonplaatsen, coördinaten wel correct zijn. Als de data in een Excel bestand is opgeslagen, dan dient deze eerst als CSV opgeslagen te worden. Hiervoor kunnen standaard tools zoals Microsoft Excel, Google Spreadsheets of Libre Office worden gebruikt. De GeoDataWizard transformeert de data, en zal alleen melding geven van adressen of woonplaatsen die niet gevonden worden in de Basisregistratie Adressen en Gebouwen. Eventuele correcties dienen in het bron bestand te worden aangebracht, en vervolgens opnieuw de stappen in de GeoDataWizard gaan doorlopen. Linked data is een digitale methode voor het publiceren van gestructureerde gegevens, zodanig dat deze beschikbaar gemaakt kunnen worden op het internet en daardoor ook beter bruikbaar zijn (bron: https://nl.wikipedia.org/wiki/Linked_data). Hiermee wordt de data “live” bevraagbaar, en kunnen talloze toepassingen gebruik maken van de data.

Een unieke feature in de GeoDataWizard is dat naast het downloaden van de getransformeerde Linked Data, ook de data direct kan publiceren in de “store” van het Platform Linked Data Nederland. Hiermee wordt de data direct voor iedereen bruikbaar, bijvoorbeeld met het maken van zogenoemde SPARQL Queries. Voorbeelden van SPARQL queries worden door het Kadaster Data Science Team gepubliceerd op labs.kadaster.nl. Een mooi voorbeeld op basis van een CSV bestand met de Stolpersteine in de Gemeente Zutphen is hier te vinden: https://labs.kadaster.nl/stories/hack-a-lod-2019/index.html

Naar de GeoDataWizard