Wikidata:Tools/OpenRefine/Editing/New items/nl

This page is a translated version of the page Wikidata:Tools/OpenRefine/Editing/New items and the translation is 100% complete.

OpenRefine kan nieuwe items maken. Deze pagina legt uit hoe deze worden gegenereerd.

Gevaarlijke zone

  • Het feit dat OpenRefine geen enkele item voorstelt bij het samenstellen van een cel betekent niet dat het item niet op Wikidata staat. Zorg ervoor dat u geen duplicaten maakt!
  • Het verwijderen van items vereist speciale rechten: als u een bewerkingsgroep wilt omkeren die nieuwe items bevat, moet u een beheerder vragen om dit te doen.

Workflow overzicht

 
Weergave van cellen die zijn afgestemd op 'nieuw', in vergelijking met een cel die is afgestemd op een bestaand item.

Hier ziet u hoe u normaal gesproken nieuwe items zou maken met OpenRefine:

  • Een kolom reserveren;
  • Markeer sommige cellen als nieuwe items. Dit zal nog geen items creëren. Als u veel rijen als nieuwe items moet markeren, gebruik dan de opdracht "Reconcile" → "Actions" → "Create a new item for each cell".
  • Maak zoals gewoonlijk een schema aan van Wikidata, met behulp van de kolom waar uw nieuwe items zijn gemarkeerd;
  • De bewerkingen uitvoeren: de nieuwe items worden op dit moment op Wikidata gecreëerd;
  • De cellen die u als nieuwe items had gemarkeerd, worden nu verenigd met de nieuw gecreëerde items.

Het is vaak nuttig (maar niet verplicht) om nieuwe items afzonderlijk te behandelen en een speciaal schema voor hen te gebruiken. Dit helpt u veel verklaringen aan de nieuwe items toe te voegen (inclusief labels en beschrijvingen) zonder het risico te lopen bestaande items te vervuilen met overbodige bewerkingen. Gebruik een facet over de beoordelingsstatus van de verenigde kolom om nieuwe items te isoleren en deze apart te bewerken. Zoals altijd in OpenRefine, worden alleen de rijen die door uw facetten worden gedekt, in overweging genomen bij het uploaden van de bewerkingen naar Wikidata: als een cel wordt verzocht met een nieuw item, maar wordt uitgesloten door het facet, wordt er geen nieuw item voor het gemaakt. [1]

Let op dat zelfs als u weet dat alle items in uw kolom nieuw zijn, u nog steeds een eerste doorloop moet maken door de Wikidata reconciliatiedienst te selecteren en vervolgens alle reconciliatiestatussen op "nieuw" te instellen. Als u het eerste deel overlaat, zal OpenRefine niet weten dat deze kolom is gecombineerd met Wikidata (het kan worden gecombineerd met andere diensten), dus zal het u niet toestaan om het te gebruiken in plaats van een item in een Wikidata schema.

U kunt ook de bewerkingen uitvoeren met QuickStatements. In dat geval zal uw OpenRefine-project niet worden bijgewerkt met de nieuw aangemaakte Qids.

Labels toevoegen aan nieuwe items

 
Problemen die zich voordoen bij het maken van slechte nieuwe items.

De tekst in een cel die is verwerkt met "nieuw" wordt niet automatisch als label gebruikt voor het nieuw gecreëerde item. Dit komt omdat OpenRefine geen manier heeft om te raden in welke taal dit label moet zijn. Bij het toevoegen van nieuwe items moet u een label uitdrukkelijk toevoegen aan het schema. Dit label kan de verzamelde kolom als bron gebruiken, maar als u andere cellen hebt die met bestaande items worden gepaard gegaan, moet u voorzichtig zijn dat u de labels van deze items niet overschrijdt (als dit niet uw bedoeling is).

OpenRefine zal weigeren bewerkingen uit te voeren waarbij nieuwe items zonder labels worden gemaakt (omdat dit als een kritisch probleem wordt beschouwd). Er zullen andere problemen worden gesteld als onvoldoende basisinformatie wordt toegevoegd over de items (maar deze andere waarschuwingen zullen u niet beletten de bewerkingen uit te voeren).

Meerdere cellen als identieke items te markeren

Als u individuele cellen als nieuwe items markeert, wordt per cel één nieuw item gecreëerd. Soms verwijzen meerdere rijen naar hetzelfde item. OpenRefine maakt het mogelijk om alle overeenkomstige cellen te markeren als het zelfde nieuwe item. Er moeten twee voorwaarden worden nagekomen:

  • de verenigde cellen moeten in dezelfde kolom zijn (het is niet mogelijk om twee cellen in verschillende kolommen als hetzelfde nieuwe item te markeren);
  • de cellen moeten dezelfde oorspronkelijke tekstwaarde bevatten.

Als aan deze twee voorwaarden is voldaan, moet u deze cellen met facetten isoleren en naar ReconcileActionsCreate one item for similar cells gaan. Hiermee worden de cellen als nieuw aangeduid en verwijzen ze naar hetzelfde item.

De Qids van de nieuw gecreëerde items ophalen

Zodra u uw bewerkingen met OpenRefine hebt uitgevoerd, worden alle nieuwe cellen die door de facetten worden gedekt, bijgewerkt met hun nieuwe Qids. U kunt deze Qids terugvinden met de actie Edit columnAdd column based on this column en met behulp van de expressie cell.recon.match.id. Let op dat u op dit moment geen nieuwe items meer met een beoordelingsfacet kunt isoleren (omdat het oordeel wordt bijgewerkt tot matched), dus het kan de moeite waard zijn om deze rijen (bijvoorbeeld met een ster of vlag) te markeren voordat u de bewerkingen uitvoert.

  1. De enige uitzondering op deze regel is wanneer meerdere cellen als identieke items worden gemarkeerd: in dit geval, als een van deze cellen in het facet wordt opgenomen, worden alle andere cellen bijgewerkt met de nieuw aangemaakte Qid zodra de bewerkingen zijn gedaan.