Wikidata:Tools/OpenRefine/nl

This page is a translated version of the page Wikidata:Tools/OpenRefine and the translation is 100% complete.

WikidataCon Award 2019
Coolest Tool Award 2022 logo

Open Refine

2022 Coolest Tool
Award Winner

in the category
Eggbeater

OpenRefine-logo
OpenRefine-logo
Aan de slag met een video tutorial
OpenRefine Tutorial voor beginners door Emma Carrol

OpenRefine is een gratis hulpmiddel voor het verbeteren van gegevens dat kan worden gebruikt om tabelgegevens op te schonen en te verbinden met kennisbanken, waaronder Wikidata. Het werd eerder ontwikkeld door Google (onder de naam Google Refine) en is nu overgegaan naar een door de community ondersteund project.

Deze pagina verzamelt OpenRefine-aanpakken die nuttig kunnen zijn om datasets in Wikidata te importeren of datasets uit te breiden met extra gegevens die uit Wikidata worden geëxtraheerd. Voel u vrij om ons via de overlegpagina om hulp te vragen met de software. Als u dit hulpmiddel graag gebruikt, kunt u het woord verspreiden met de {{User loves OpenRefine}} gebruikersbox.

OpenRefine ondersteunt momenteel alleen het afstemmen van items. Lexemen worden vanaf september 2022 niet meer ondersteund.

Installatie en uitvoeren van OpenRefine

OpenRefine kan als een applicatie worden gedownload. Het werkt op desktop- en laptopcomputers met Windows-, Mac- en Linux-besturingssystemen. Het draait een kleine server op uw computer en u gebruikt vervolgens een webbrowser om ermee te communiceren. Het werkt het beste met webbrowsers op basis van Webkit, zoals Google Chrome, Chromium, Opera en Microsoft Edge, en wordt ook ondersteund op Firefox.

OpenRefine heeft een grafische gebruikersinterface die beschikbaar is in meer dan 15 talen.

Installeer OpenRefine op uw eigen desktop of laptop

U kunt de nieuwste stabiele release van OpenRefine vinden en downloaden.

Voer OpenRefine uit op PAWS

Sinds mei 2021 kan iedereen met een geregistreerd Wikimedia-account OpenRefine in PAWS uitvoeren op Wikimedia's Cloud Services. Houd er rekening mee dat dit een experimentele functie is die niet wordt ondersteund door het OpenRefine-team zelf, en die kan breken of defect kan raken. Het is echter een interessante optie voor mensen die geen software op hun lokale computer kunnen installeren.

PAWS is een Wikimedia Cloud-hulpmiddel die gehoste toegang biedt tot Jupyter-notebooks en andere hulpmiddelen zonder dat er een lokale installatie nodig is.

U kunt toegang krijgen tot uw eigen installatie van OpenRefine via deze link: https://hub-paws.wmcloud.org/hub/user-redirect/openrefine. U moet inloggen met uw wiki-inloggegevens, maar vink het vakje Onthoud mij niet aan: aangezien alle bestanden die op PAWS zijn geschreven openbaar beschikbaar zijn, wilt u uw inloggegevens niet toegankelijk maken. Het is ook mogelijk dat u een foutmelding krijgt; Als dat het geval is, vernieuw dan de pagina en het zou moeten werken.

Neem contact op met YuviPanda met vragen over OpenRefine via PAWS.

Hoofdfuncties

Wikidata-reconciliatie

In OpenRefine-terminologie is 'reconciliatie het proces van het koppelen van vrije-tekst tabelcellen aan id's in kennisbanken. De ingebouwde afstemmingsmogelijkheden van OpenReduce maken het een veelzijdig hulpmiddel om tabelgegevens af te stemmen op een breed scala aan databases, waaronder Wikidata.

 
Semi-automatische reconciliatie van universiteiten in OpenRefine

OpenRefine's wiki bevat een gedetailleerde gids voor het afstemmingsproces. Dit zijn de belangrijkste kenmerken:

  • Beperk de afstemming tot een Wikidata-klasse. Alleen items uit subklassen van deze Wikidata-klasse worden in aanmerking genomen;
  • Gebruik meerdere kolommen in uw dataset en vergelijk ze met waarden van eigenschappen in Wikidata, die de afstemmingsscore verfijnt en fungeert als een tiebreaker tussen naamgenoten;
  • Gebruik de externe id's die door uw dataset en Wikidata worden gedeeld om uw items met elkaar in overeenstemming te brengen;
  • Gebruik de sitelinks in uw dataset als externe id's - als deze Wikimedia-pagina's zijn gekoppeld aan een Wikidata-item, worden ze daar automatisch mee afgestemd.

Als u de afstemmingsfuncties wilt gebruiken, kunt u overwegen het volgende instructiemateriaal te gebruiken:

API's kunnen bijvoorbeeld een zoekopdracht zijn op frlabels met wikidata dankzij deze link https://wikidata.reconci.link/fr/api.

Gegevensvergroting

 
Deze screencast laat zien hoe u nieuwe kolommen toevoegt op basis van een afgestemde kolom in OpenRefine 2.8.

Deze functie is beschikbaar vanaf OpenRefine 2.8.

Zodra een kolom van uw tabel is afgestemd op Wikidata, kunt u gegevens uit Wikidata ophalen en andere kolommen in uw gegevensset maken. Als er meerdere claims zijn voor een bepaalde eigenschap, worden de waarden gegroepeerd als records in OpenRefine: ze worden opgeslagen in extra rijen waar de oorspronkelijke afgestemde kolom leeg is. De recordmodus van OpenReduce is daarom misschien meer geschikt voor de latere transformaties die u op uw tafel wilt uitvoeren. Toegang tot itemlabels, artikelbeschrijvingen en itemsitelinks wordt geboden door de eigenschappen Lxx, Dxx en Syyyy, waarbij xx een taalcode is (en, fr, yue, enz.) en yyyy een site-ID (enwiki, ptwikisource, enz.).

U kunt deze functie recursief gebruiken op de nieuw gemaakte kolommen als deze overeenkomen met Wikidata-items. Hiermee kunt u de Wikidata-grafiek verkennen langs geselecteerde eigenschappen. Het is ook mogelijk om de manier waarop u de eigenschappen ophaalt op verschillende manieren te configureren (bijvoorbeeld filteren op rang of verwijzingen).

Wikidata bewerken

Deze functie is beschikbaar vanaf OpenRefine 3.0.

OpenRefine kan u helpen bij het transformeren van tabelgegevens in Wikidata verklaringen. Dit werkt door een schema te maken - een sjabloon van Wikidata-bewerking die wordt toegepast op elke rij van uw tabel. Nadat u een schema hebt gemaakt, kunt u het volgende doen:

  • bekijk een voorbeeld van de Wikidata-bewerkingen en inspecteer ze handmatig;
  • analyseren en oplossen van eventuele problemen die automatisch door het hulpmiddel worden opgeroepen;
  • upload uw wijzigingen naar Wikidata door in te loggen met uw eigen account;
  • exporteer de wijzigingen naar het QuickStatements v1-formaat.

Zie de bewerkingspagina voor meer details. Er zijn veel tutorials beschikbaar om u op weg te helpen.

Organiseren

OpenRefine-werkstromen kunnen worden gedeeld door de JSON-weergave van de bewerkingsgeschiedenis te kopiëren. Dit vertegenwoordigt de bewerkingen die u in OpenFine hebt uitgevoerd en kan door anderen worden hergebruikt voor vergelijkbare gegevenssets. In dit gedeelte vindt u enkele aanpakken die nuttig kunnen zijn bij het werken met Wikidata. Zie ook OpenRefine Recipes.

  • Het verkrijgen van Wikidata Q-nummers. Zodra u een kolom hebt afgestemd op Wikidata, kunt u de Qid's in een nieuwe kolom verkrijgen door de bewerking Kolom toevoegen op basis van deze kolom te gebruiken met de volgende GREL-expressie: cell.recon.match.id
  • Meer variabelen. U hebt toegang tot veel verschillende variabelen voor de afgestemde cel. Zie de referentiepagina voor variabelen.
  • Deel uw aanpak hier!

Help OpenRefine

OpenRefine heeft uw hulp nodig! Er zijn veel dingen die u kunt doen:

We hebben een Phabricator-project om de activiteiten rond OpenRefine binnen Wikimedia te volgen; voel u vrij om elke gerelateerde taak ermee te taggen.

In 2021-22 wordt OpenRefine uitgebreid met ondersteuning voor gestructureerde gegevens op Wikimedia Commons (SDC). Dit project wordt gefinancierd door een gift.