Wikidata:Linked open data workflow

This page is a translated version of the page Wikidata:Linked open data workflow and the translation is 75% complete.
Outdated translations are marked like this.
Other languages:

Il y a de nombreuses choses à prendre en compte quand on importe des données, des fichiers ou d'autres contenus sur les projets Wikimedia. Ce tableau essaie d'en lister certaines et de fournir des outils et scripts dans le workflow des données ouvertes liées.

PRÉPARER et ranger les données et images source ALIGNER avec le modèle et les contenus de Wikimedia IMPORTER les données et les fichiers ANALYSER, corriger et enrichir RÉ-UTILISER les contenus sur les wikis et en dehors RENDRE COMPTE et mesurer
Notes

Essayez de trouver un projet ou une collection similaire sur Wikidata or Commons pour voir comment cela a été fait dans le passé.


Posez vos questions sur la page de discussion du projet sur Wikidata ou le Village Pump sur Wikimedia Commons.


Les personnes ou institutions donnant des contenus doivent s'assurer que ceux-ci sont sous une licence libre ou que les droits d'auteurs ont expiré. Une façon simple de préparer les images pour Commons est d'importer les collections sur Flickr et définir des licences correctes pour les images (CC0, CC-BY, CC-BY-SA). N'utilisez pas de licences non-commerciales (NC).

Wikidata utilise une licence CC0 : tout contenu fourni doit être sous CC0 ou domaine public.

Notes

Pour Wikidata, une base de données de transition est généralement nécessaire pour associer les termes du jeu de données source (un fichier CSV ou des enregistrements d'une API) en termes Wikidata. Cela peut être fait avec OpenRefine, un alignement manuel fait avec Google Spreadsheet ou les deux.


Vérifiez quelles entités et propriétés existent déjà dans Wikidata et quelles catégories et modèles sont utilisés sur Commons.

Regardez comment les éléments existants sont modélisés dans Wikidata pour fournir les bonnes propriétés instance of (P31) et subclass of (P279) pour les nouveaux éléments.

Besoin d'une étude de cas ici.

Notes

Essayez d'importer de petits lots avant de passer à de grands jeux de données.

En important les collections de fichiers et métadonnées sur Commons et Wikidata, vous devez trouver un moyen d'être sûr qu'elles soient corrélées. Le numéro d'inventaire ou d'accession (inventory number (P217)) est souvent utilisé pour des objets, avec un qualificatif la collection (collection (P195)) et l'institution. Une bonne pratique sur Commons est d'inclure dans le nom du fichier le nom de l'institution/source, numéro d'inventaire et si possible un titre descriptif.


Mettre inventory number (P217) dans la description d'un élément Wikidata peut aider à distinguer des éléments qui ont des noms très similaires, par exemple « Sans titre » ou Nature morte avec fleurs.

Besoin d'une étude de cas ici.

Notes

Selon la façon dont se passent l'import des fichiers et données, vous pouvez avoir à gérer des doublons ou des conflits d'édition.


Pour Commons, vous pouvez avoir à déplacer des fichiers ou ajouter des catégories supplémentaires.


Vous pouvez avoir besoin de créer des requêtes de maintenance personnalisées pour garder trace de votre contenu au fil du temps, ou pour continuer à ajouter des propriétés et des métadonnées au-delà de la contribution initiale.

Notes

Des scripts et modèles peuvent générer du contenu sur le wiki comme des tableaux et des infoboxes utilisant les données de Wikidata.


Si des identifiants ou enregistrements d'autorités de contrôles sont importés, Wikidata peut servir de base de données pivot pour lier les informations avec de nombreuses autres bases de données.

Notes

Montrez l'impact des contributions en gardant des métriques des fichiers utilisés ou des pages vues au fil du temps. Pour les partenariats, cela peut aider à valider le travail déjà fait ou encourager une collaboration ultérieure.


Certains outils sont sur demande (GLAMorgan) et d'autres font des rapports réguliers en se basant sur les catégories Commons des institutions culturelles.


Vous pouvez aussi utiliser Wikidata Query pour faire des rapports personnalisés sur la couverture ou l'utilisation.

Outils et scripts

Convertissez les fichiers PDF en données structurées. Si vos données d'origine ne sont pas très bien formatées, tentez un outil de scraping comme Tabula

Outils et and scripts
English:
Tutorial vidéo d'OpenRefine par Sandra Fauconnier à la conférence GLAM WIKI 2018.
Outils et scripts

Pattypan est la façon la plus populaire de faire des imports de masse d'images à l'aide d'un tableur pour rassembler les métadonnées nécessaires à chaque fichier. Trouvez le modèle correct pour les œuvres d'art, photos ou autres supports et identifiez les bonnes catégories pour ranger les fichiers.


Quickstatements prend des directives sous forme de CSV pour créer des déclarations Wikidata.


L’API Mediawiki fournit un environnement de programmation avec Python (PyWikibot ou PAWS) pour faire des actions avancées.

Outils et scripts

Vérifier la complétude des propriétés :

English:
Wikidata:WikiProject sum of all paintings/Property statistics - User:Multichill script sur Github

InteGraality - User:Jean-Frédéric script to generate custom dashboards of property coverage for a given part of Wikidata.

Properties dashboard for Metropolitan Museum of Art

Wikimedia Commons Data Roundtripping project and report

Outils et scripts

Infobox tutorials:

Wikidata:Infobox_Tutorial - how to create Wikidata-powered infoboxes or other templates for Wikipedia and other projects connected to Wikidata

Infoboxes utilisant Wikidata sur les catégories Commons :

Template:Wikidata Infobox - créé par User:Mike Peel

Outils et scripts

Requêtes Wikidata pour montrer que les statistiques des contributions du Met Museum sur Wikidata :

PAWS notebook par User:Fuzheado

Liens

  • English:
    Data and media partnerships workflow - Considérations générales sur les partenariats de données et media, incluant une série d'outils pour Wikidata et Wikimedia Commons.