Wikidata:Tools/OpenRefine/Editing/Quality assurance/nl

This page is a translated version of the page Wikidata:Tools/OpenRefine/Editing/Quality assurance and the translation is 100% complete.
Voorbeelden van problemen die door OpenRefine zijn gemeld in een voorbeeldproject.

Op deze pagina wordt uitgelegd hoe de extensie OpenRefine bewerkingen analyseert voordat ze worden geüpload naar Wikidata.

Overzicht

Wijzigingen worden onder de loep genomen voordat ze worden geüpload, maar ook voordat de huidige inhoud van de bijbehorende items wordt opgehaald en samengevoegd met de updates. Dit betekent dat sommige overtredingen van beperkingen niet kunnen worden voorspeld door de software (bijvoorbeeld het toevoegen van een nieuwe verklaring die in strijd is met een bestaande verklaring op het item). Dit maakt het echter mogelijk om de controles snel uit te voeren, zelfs voor relatief grote batches bewerkingen. Issues worden daarom in realtime vernieuwd terwijl de gebruiker het schema bouwt.

Als gevolg hiervan kunnen niet alle overtredingen van beperkingen worden gedetecteerd: de schendingen die worden ondersteund, worden vermeld in de sectie Overtredingen van beperkingen. Omgekeerd zullen niet alle gemelde problemen worden gemarkeerd als overtredingen van beperkingen op Wikidata: zie Algemene kwesties.

Reconciliatie

U moet altijd eerst de kwaliteit van uw reconciliatie resultaten beoordelen. OpenRefine beschikt over verschillende instrumenten voor de kwaliteitsborging van de resultaten van de reconciliatie. Bijvoorbeeld:

  • u kunt de gelijkenis van de tekenreeks tussen uw oorspronkelijke namen en die van de afgestemde items analyseren (bijvoorbeeld met ReconcileFacetsBest candidate's name edit distance);
  • u kunt de waarden in uw tabel vergelijken met die op de items (via een tekstfacet gedefinieerd door een aangepaste expressie);
  • u kunt facetten per type op de samengestelde items toevoegen (voeg een nieuwe kolom met de types toe en gebruik een tekstfacet op orde van aantal om een betekenis te krijgen van de verdeling van de types in uw samengesteld items).

Overtredingen van beperkingen

Beperkingen (constraints) worden opgehaald zoals gedefinieerd bij de eigenschappen, met gebruik van property constraint (P2302).

De volgende beperkingen worden ondersteund:

  • inverse constraint (Q21510855): OpenRefine gaat ervan uit dat de omgekeerde verklaring van de kandidaatverklaringen nog niet in Wikidata staan. Als u weet dat de omgekeerde verklaringen al in Wikidata staan, kunt u dit probleem gerust negeren.
  • single-value constraint (Q19474404): Dit wordt alleen geactiveerd als u meer dan één verklaring toevoegt met de eigenschap voor hetzelfde item, maar er worden geen bestaande verklaringen met deze eigenschap gedetecteerd.

Een vergelijking van de ondersteunde beperkingen met betrekking tot andere implementaties is hier beschikbaar.

Algemene punten

OpenRefine detecteert ook problemen die niet (nog) zijn gemarkeerd door beperkingen (constraints) in Wikidata:

  • Verklaringen zonder referenties. Dit is niet afhankelijk van citation needed constraint (Q54554025): van alle verklaringen wordt verwacht dat ze referenties hebben. (Het idee is dat bij het importeren van een dataset, elke verklaring die u toevoegt naar deze dataset moet linken - het kan geen kwaad om dit te doen, zelfs niet voor generieke eigenschappen zoals instance of (P31).)
  • Valse witte ruimte en niet afdrukkbare tekens in strings (inclusief labels, beschrijvingen en aliassen);
  • Zelf-refererende verklaringen (verklaringen waarin wordt vermeld tot welk item zij behoren);
  • Nieuwe items zonder label;
  • Nieuwe items aangemaakt zonder beschrijving;

Ondersteuning toevoegen voor een nieuwe beperking

Als u Java kent, is het eenvoudig om een nieuwe beperking toe te voegen! Kijk maar eens naar voorbeelden van scrutinizers (zo worden beperkingscheckers/onderzoekers intern genoemd) zoals SingleValueScrutinizer of FormatScrutinizer en schrijf een vergelijkbare klasse die het probleem detecteert dat u wilt benadrukken. Schrijf de bijbehorende testklasse (zoals SingleValueScrutinizerTest of FormatScrutinizerTest) die de problemen aantoont die door uw scrutinizer aan de orde zijn gesteld. Registreer ten slotte uw scrutinizer in EditInspector zodat deze samen met de rest van de scrutiniizers wordt uitgevoerd op alle kandidaat-bewerkingen. Dien uw code in als pull-aanvraag bij https://github.com/OpenRefine/OpenRefine.

Als u daar hulp bij nodig heeft, ping dan gebruiker Pintoch die u graag helpt.