Wikidata:Tools/OpenRefine/Edition/Nouveaux éléments

This page is a translated version of the page Wikidata:Tools/OpenRefine/Editing/New items and the translation is 100% complete.

OpenRefine peut créer de nouveaux éléments. Cette page explique comment ils sont générés.

Zone à risque

  • Le fait qu'OpenRefine ne propose aucun élément lors de la réconciliation d'une cellule n'implique pas nécessairement qu'aucun élément n'existe sur ce sujet dans Wikidata. Assurez-vous, s'il vous plaît, que vous ne créez pas de doublons !
  • Supprimer des éléments demande des droits spéciaux: si vous voulez annuler un groupe de modifications qui contient de créations de nouveaux éléments, vous allez devoir demander à un administrateur de le faire.

Aperçu du processus

 
Apparence de cellules réconciliées à un nouvel élément, en comparaison avec les cellules réconciliées à un élément existant.

Voici comment on peut créer des nouveaux éléments avec OpenRefine:

  • Réconciliez une colonne;
  • Marquez certaines de ses cellules comme réconciliées à des nouveaux éléments. Cela ne va pas immédiatement créer les nouveaux éléments en question. Si vous devez marquer beaucoup de cellules, utilisez l'action ReconcileActionsCreate a new item for each cell.
  • Créez un schéma Wikidata comme d'habitude, en utilisant la colonne où les nouveaux éléments sont marqués;
  • Effectuez les modifications: les nouveaux éléments seront créés sur Wikidata à ce moment;
  • Les cellules que vous avez marquées comme nouveaux éléments sont maintenant réconciliées aux éléments qui ont été créées pour elles.

Il est souvent utile (mais pas obligatoire) de traiter les nouveaux éléments à part et d'utiliser un schéma spécifique pour eux. Cela vous aidera à ajouter beaucoup d'informations sur les nouveaux éléments (y compris des libellés et des descriptions) sans risquer de salir des éléments existants avec des modifications redondantes. Utilisez une facette sur l'état de réconciliation de la colonne pour isoler les nouveaux éléments et effectuer leurs modifications séparément. Comme toujours dans OpenRefine, seule les lignes couvertes par vos facettes seront prises en compte lors de l'envoi des modifications à Wikidata: si une cellule est réconciliée à un nouvel élément main est exclue par les facettes, aucun nouvel élément ne sera créée pour elle.[1]

Notez que même si vous savez que tous les éléments de votre colonne sont nouveaux, il vous faudra encore faire une première passe de réconciliation en choisissant le service de réconciliation de Wikidata, puis en positionnant tous les états de réconciliation à new. Si vous sautez cette première étape, OpenRefine ne saura pas que la colonne est réconciliée avec Wikidata (elle pourrait être réconciliée avec d'autres services) et il ne vous permettra pas de l'utiliser à la place d'un élément dans un schéma Wikidata.

Vous pouvez aussi effectuer les modifications avec QuickStatements - dans ce cas, votre projet OpenRefine ne sera pas mis à jour avec les nouveaux Qids.

Ajouter des libellés aux nouveaux éléments

 
Problèmes détectés quand de nouveaux éléments sont créés sans ajouter d'informations.

Le texte qui est dans une cellule réconciliée à un nouvel élément n'est pas automatiquement utilisé comme libellé pour ce nouvel élément. La raison pour cela est qu'OpenRefine n'a aucune manière de deviner pour quel langue ce libellé doit être appliqué. Quand vous créez de nouveaux éléments, vous devez explicitement ajouter un libellé dans le schéma. Ce libellé peut utiliser la colonne réconciliée comme source, mais si vous avez avez d'autres cellules réconciliées à des éléments existants, faites attention à ne pas remplacer les libellés de ces éléments (si ce n'est pas votre intention).

OpenRefine refusera d'effectuer des modifications où de nouveaux éléments sont créés sans aucun libellés (car c'est considéré comme un problème critique). D'autres problèmes seront signalés s'il manque d'autres informations de base sur les éléments (mais ces problèmes ne vous empêcheront pas d'effectuer les modifications).

Lier plusieurs cellules au même nouvel élément

Si vous liez des cellules à des nouveaux éléments une par une, un élément par cellule sera créé. Parfois, plusieurs lignes font référence au même nouvel élément. OpenRefine permet de marquer toutes ces cellules comme correspondant au même nouvel élément. Deux conditions sont requises :

  • les cellules réconciliées doivent être dans la même colonne (il est impossible de lier deux cellules dans des colonnes différentes au même nouvel élément) ;
  • les cellules doivent contenir la même valeur textuelle avant réconciliation.

Si ces deux conditions sont remplies, vous pouvez isoler ces cellules avec des facettes et utiliser ReconcilierActionsCréer un élément pour par cellules similaires. Cela marquera les cellules comme correspondant au même nouvel élément.

Récupérer les Qids des éléments nouvellement créés

Une fois que vous avez envoyé vos modifications sur Wikidata, toute nouvelle cellule couverte par vos facettes sera mise à jour avec son nouveau Qid. Vous pouvez récupérer ces Qids avec l'opération Edit columnAdd column based on this column et en utilisant l'expression cell.recon.match.id. Notez que vous ne pourrez plus isoler les nouveaux items avec une facette de jugement à cette étape (puisque les jugements auront été mis à jour vers matched), donc il peut être judicieux de marquer ces lignes avant d'envoyer les modifications (par exemple avec une étoile ou un drapeau).

  1. La seule exception à cette règle est quand plusieurs cellules sont marquées comme correspondant au même nouvel élément: dans ce cas, si l'une d'entre elles est inclue par les facettes, alors toutes les autres seront mises à jour avec le nouvel élément correspondant une fois que les modifications seront faites.