User:2le2im-bdc/openrefine

Cette page regroupe des notes personnels sur l'utilisation d'Openrefine pour la reconciliation de données et la publication dans Wikidata.

Voir aussi la page de notes dédiée sur l'utilisation de Wikidata.

Documentation edit

Liste de discussion : [1]

Liste des bugs et améliorations : [2]

Le développeur de l'extension Wikidata/Openrefine : Pintoch (Antonin Delpeuch, @pintoch sur Mastodon)

Tutoriel edit

Marche à suivre edit

Dans cette partie sont regroupés pêle-mêle des points à ne pas oublier.

Création de nouveaux éléments Wikidata à partir de Openrefine edit

Attention : lorsque vous souhaitez créer des éléments totalement nouveaux dans Wikidata à partir de Openrefine, il faut faire attention aux points suivants [1] :

  • Si vous lancez une reconciliation sur une colonne comportant que des éléments nouveaux en suivant la procédure Réconcilier->Action>"Créer un nouveau sujet pour chaque cellule". Cette action fonctionne et affiche 100% d'élément nouveaux. Mais lorsque l'on souhaite éditer le schéma en vue de leur import dans Wikidata, on n'arrive pas à sélectionner cette colonne pour en-tête d'élément (le premier champs à spécifier). Elle est inactive au sens de Wikidata.
  • Le problème vient du fait que Openrefine ne sait pas avec quel service externe on veut les réconcilier et Wikidata ne les reconnaît dès lors pas.
  • Pour contourner, ce problème, on peut faire deux choses:
    • soit lancer une réconciliation"classique" tout d'abord en sélectionnant Wikidata, puis dans un second temps lancer l'action "Créer un nouveau sujet pour chaque cellule".
    • soit choisir Réconcilier->"Utlisser les valeurs comme identifiants", en choisissant Wikidata.
  • Dans les deux cas, Wikidata sera identifié et la colonne "valide" pour sa sélection dans le schéma.
  • Il existe un ticket de développement d'Openrefine qui documente cette difficulté.

Notes edit

  1. Je remercie Pintoch de m'avoir indiqué ces solutions et ces informations.