Wikidata:Pywikibot - Tutoriel Python 3
Avertissement : pywikibot ne prend pas en charge actuellement les objets de données lexicales tels que les lexèmes (phab:T189321). A la place utilisez WikibaseIntegrator ou LexData pour les éditer. |
Ce tutoriel est une mise-à-jour du tutoriel Wikidata:Creating a bot. Mais c'est aussi une extension de courte durée totalement indépendante qui vous montrera comment travailler avec Python 3, Wikidata et Pywikibot pour manipuler de grands ensembles de données.
La plupart du texte est réécrite pour être plus expressive et adaptée au personnes qui ont peu ou moins d'expérience en programmation. L'intérêt du lecteur dans Wikidata pourrait simplement être le fait de vouloir apprendre à programmer.
Pour pouvoir suivre le cours vous devez avoir quelques jours ou idéalement quelques semaines d'expérience en Python 3. Le but est d'atteindre un niveau où vous pourrez lancer un robot pour ramener et modifier des informations et de transférer de l'information vers d'autres outils de votre flux de travail.
L'utilisation de Python et Pywikibot permettra à tout le cours d'être dans un même langage de programmation. C'est un langage qui n'est pas simplement facile à apprendre, mais qui apparaît aussi comme le plus utilisé dans les sciences qui utilisent les données. Cibler Python 3 (remarquez la version) permettra à la formation d'avoir une approche plus native concernant le caractère multi-langue de Wikidata.
N'importe qui peut modifier ce tutoriel ou poser des questions sur les différentes pages de discussion.
Installation
Vous pouvez développer des robots aussi bien en ligne que hors-ligne.
Voici l'option recommandée pour la plupart des utilisateurs :
- https://hub-paws.wmcloud.org/ - Une présentation générale rapide et la configuration de PAWS se trouvent sur le site web MediaWiki, alors que la documentation complète est sur wikitech.
Hors-ligne, installé sur votre ordinateur
- Installer Shop: installation, configuration
Introduction
Ce bloc d'apprentissage concerne la paramétrisation de pywikibot, la requête des données, - en utilisant des fonctions, l'itération et les générateurs, - et l'écriture de données dans un fichier ou une base de données.
- Moisson des données: Récupérer des données à partir d'un élément Wikidata
- Grenier d'hiver: Ecrire des données dans un fichier ou dans la base de données
- Données en masse: Travailler avec de très gros ensembles de données
Après avoir fini les trois premiers chapîtres, gratifiez-vous du badge {{User Pywikibot basic}} . Félicitations !
This user has basic understanding of the Pywikibot software library. |
Modifier Wikidata
Ce bloc d'apprentissage traite l'écriture dans Wikidata et la comparaison des valeurs entre Wikipedia et Wikidata.
- Informations concernant la modification par robot
- Etiquettes: Déclarer des étiquettes, des descriptions et des alias.
- Définir des liens de site
- Ecrire des déclarations
- Changing Items: Corriger les remarques de liens relatifs à un élément erronné.
- Quantities and Units: Ajouter une quantité de remarques avec une incertitude et des unités.
- Définir des qualifieurs
- Définir des sources
Après avoir terminé le second bloc gratifiez-vous du badge {{User Pywikibot advanced}} . Félicitations!
This user has an advanced understanding of the Pywikibot software library. |
Sujets et exemples expert
Ce bloc est formé d'exemples avancés qui vont au-delà de l'itération sur Wikidata et des instructions get ou set. Cela inclut par exemple les modèles qui sont utilisés sur Wikidata. Vous pouvez simplement lire et essayer les chapîtres qui vous intéressent.
- Modèles: exemples pour chercher certains modèles, les instructions qui les composent, et la manière de les modifier.
- Modèles, Générateurs, Tables: itérez sur l'utilisation des modèles et créez automatiquement des tables wiki
- Messages des pages de discussion : Apprenez à déposer des messages sur les pages de discussion.
- Récupérer les données de Wikipedia en langue arabe: Apprenez comment obtenir et comparer des données provenant de wikis où l'écriture se fait de droite à gauche.
- Itération avec une requête SPARQL: cette leçon montre comment itérer avec un requête SPARQL.
- Page vues : obtenir le nombre de pages vues à partir d'éléments et des pages liées
- Créer des éléments: les robots peuvent créer les éléments manquants
- Fusionner des éléments
- Obtenir le nombre total de pages d'une catégorie ou d'un espace de noms
- Téléverser des images et écrire des pages sur Commons
- Données structurées sur Commons (SDC)
- Lexème
- Schéma des entités
- L'apprentissage machine avec Wikidata
- Autres idées à venir
- ...
- ..
- .
Après avoir terminé le troisième bloc, ou si vous êtes déja expérimenté avec les robots sur Wikidata, vous pouvez vous gratifier avec la badge {{User Pywikibot professional}}. Félicitations !
This user is a Pywikibot expert. |
Ressources utiles
- Wikidata:SPARQL query service : ressources concernant Wikidata Query Service (Q20950365)
- https://se.wikimedia.org/wiki/Projekt:Botacademy_2015 : un magasin de robots en Suède (28-29 novembre 2015)
- Wikidata:Creating a bot : une introduction sur pywikibot et d'autres robots.
- Ajout des exemples de code de la session sur pywikibot sous PAWS au Wikimania 2016
- https://wikitech.wikimedia.org/wiki/PAWS