Wikidata:Pywikibot – Python-3-Tutorial
Warnung: Pywikibot unterstützt derzeit keine lexikalischen Datenobjekte wie Lexeme (phab:T189321). Nutze stattdessen WikibaseIntegrator oder LexData, um diese zu bearbeiten. |
Dies ist ein Update des Tutorials Wikidata:Creating a bot. Es stellt jedoch auch eine Erweiterung in einen völlig unabhängigen Kompaktkurs dar, der dir zeigt, wie man mit Python 3, Wikidata und Pywikibot arbeitet, um große Datensätze zu verarbeiten.
Der größte Teil des Textes wurde umgeschrieben, um Personen mit wenig oder keinen Programmierkenntnissen entgegenzukommen. Allein das Interesse des Lesers an Wikidata könnte der Grund dafür sein, das Programmieren lernen zu wollen.
Um dem Kurs zu folgen, solltest du einige Tage oder idealerweise ein paar Wochen Erfahrung in Python 3 haben. Das Ziel ist es, ein Level zu erreichen, auf dem du einen Bot laufen lassen kannst, um Informationen zu sammeln und zu bearbeiten und die Informationen zwischen deinen Tools zu übertragen.
Die Nutzung von Python und Pywikibot wird es dir erlauben, den ganzen Kurs in einer Programmiersprache zu absolvieren. Eine Sprache, die nicht einfach zu lernen ist, aber zu den am häufigsten genutzten Sprachen in den Datenwissenschaften gehört. Die Fokussierung auf Python 3 (Schwerpunkt der Version) wird dem Kurs einen nativen Ansatz für die vielsprachige Natur von Wikidata geben.
Jeder kann dieses Tutorial bearbeiten und auf den Diskussionsseiten Fragen stellen.
Installation
Du kannst Bots on- oder offline entwickeln.
Online, in deinem Webbrowser (PAWS)
Dies ist die empfohlene Variante für die meisten Benutzer:
- https://hub-paws.wmcloud.org/ - Eine kurze Übersicht und die Einrichtung von PAWS können auf der MediaWiki-Website gefunden werden, während sich die vollständige Dokumentation auf Wikitech befindet.
Offline, auf deinem Computer installiert
- Einen Shop aufsetzen: Installation, Konfiguration
Einführung
Diese Lerneinheit fokussiert sich auf die Einrichtung des Pywikibots, Datenabfragen — mit Funktionen, Iterationen und Generatoren — und das Schreiben von Daten in eine Datei oder Datenbank.
- Data Harvest: Sammeln von Informationen aus einem Wikidata-Datenobjekt
- Winter Storage: Daten in eine Datei oder Datenbank schreiben
- Big Data: Iterierung großer Datensätze
Zeichne dich nach dem Absolvieren der ersten drei Kapitel mit dem {{User Pywikibot basic}}-Babel aus. Glückwunsch!
This user has basic understanding of the Pywikibot software library. |
Wikidata bearbeiten
Diese Lerneinheit fokussiert sich auf das Schreiben in Wikidata und den Vergleich von Werten aus Wikipedia und Wikidata.
- Informationen über Botbearbeitungen
- Bezeichnungen: Bezeichnungen, Beschreibungen und Alternativnamen setzen.
- Seitenlinks setzen
- Aussagen setzen
- Datenobjekte ändern: Behauptungen, die auf ein falschen Datenobjekt verlinken, korrigieren.
- Mengen und Einheiten: Eine Mengenbehauptung mit Unsicherheit und Einheiten angeben.
- Qualifikatoren setzen
- Fundstellen setzen
Zeichne dich nach dem Absolvieren der zweiten Lerneinheit mit dem {{User Pywikibot advanced}}-Babel aus. Glückwunsch!
This user has an advanced understanding of the Pywikibot software library. |
Expertenthemen und Beispiele
Diese Lerneinheit besteht aus fortgeschrittenen Beispielen, die über den Datenabruf aus Wikidata und das Setzen von Aussagen hinausgehen. Dies umfasst beispielsweise Vorlagen, die in Wikidata genutzt werden. Du kannst dir einfach die Kapitel durchlesen, die dich interessieren und sie ausprobieren.
- Vorlagen: Beispiele, wie man nach bestimmten Vorlagen und den in ihnen enthaltenen Information sucht und sie bearbeitet.
- Vorlagen, Generatoren und Tabellen: Vorlagennutzungen abrufen und Wiki-Tabellen automatisch erstellen
- Diskussionsseitennachrichten: Lerne, wie man Nachrichten auf Diskussionsseiten hinterlässt.
- Daten aus der arabischsprachigen Wikipedia abrufen: Lerne, wie man Daten aus Wikis, die von rechts nach links geschrieben sind, abruft und vergleicht.
- Durchlaufen einer SPARQL-Abfrage: Diese Lektion zeigt, wie eine SPARQL-Abfrage durchlaufen wird.
- Seitenaufrufe: Erhalte die Seitenaufrufe von datenobjekten und verlinkten Seiten
- Datenobjekte erstellen: Bots können fehlende Datenobjekte erstellen
- Datenobjekte zusammenführen
- Die Summe aller Seiten einer Kategorie oder eines Namensraums erhalten
- Auf Commons Bilder hochladen und Seiten bearbeiten
- Strukturierte Daten auf Commons (SDC)
- Lexeme
- EntitySchema
- Maschinelles Lernen mit Wikidata
- Weitere Ideen benötigt
- ...
- ..
- .
Nach dem Absolvieren der dritten Lerneinheit oder wenn du bereits Erfahrung mit dem Betreiben von Bots auf Wikidata hast, kannst du dich mit dem {{User Pywikibot professional}}-Babel auszeichnen. Glückwunsch!
This user is a Pywikibot expert. |
Hilfreiche Quellen
- Wikidata:SPARQL query service: Quellen zum Wikidata Query Service (Q20950365)
- https://se.wikimedia.org/wiki/Projekt:Botacademy_2015: Ein Bot-Workshop in Schweden (28. -29. November 2015)
- Wikidata:Creating a bot: Eine Einleitung zum Pywikibot und anderen Bots.
- Nutze Code-Beispiele einer Sitzung über Pywikibot auf PAWS bei der Wikimania 2016
- https://wikitech.wikimedia.org/wiki/PAWS