Wikidata:Datenbank-Download

This page is a translated version of the page Wikidata:Database download and the translation is 91% complete.
Outdated translations are marked like this.
Other languages:
Bahasa Indonesia • ‎Bahasa Melayu • ‎Deutsch • ‎English • ‎Esperanto • ‎Lëtzebuergesch • ‎Nederlands • ‎Ripoarisch • ‎Türkçe • ‎català • ‎dansk • ‎dolnoserbski • ‎español • ‎français • ‎hornjoserbsce • ‎italiano • ‎latviešu • ‎norsk bokmål • ‎occitan • ‎polski • ‎português do Brasil • ‎suomi • ‎svenska • ‎čeština • ‎Ελληνικά • ‎беларуская • ‎македонски • ‎русский • ‎српски / srpski • ‎українська • ‎հայերեն • ‎עברית • ‎العربية • ‎فارسی • ‎پښتو • ‎हिन्दी • ‎বাংলা • ‎ગુજરાતી • ‎ไทย • ‎ქართული • ‎中文 • ‎日本語 • ‎한국어

Crystal Project Db update.png

Wikidata bietet Kopien des verfügbaren Inhalts zum Herunterladen für jeden.

Es gibt weitere andere Methoden um auf die Datenbank zuzugreifen, die keinen kompletten Dump der Datenbank benötigen.

Datenbank Dumps

Es sind unterschiedliche Arten von Datenband-Dumps verfügbar. Beachte, dass JSON- und RDF-Dumps als stabile Schnittstellen gelten, XML-Dumps hingegen nicht. Änderungen an den Datenformaten, die von stabilen Schnittstellen genutzt werden, unterliegen der Stable Interface Policy.

JSON Dumps (empfohlen)

JSON Dumps die alle Wikidata Datensätze als eine Liste enthalten, finden sich auf https://dumps.wikimedia.org/wikidatawiki/entities/. Sie werden wöchentlich erstellt. Die Entitäten im Array sind nicht zwangsläufig in einer bestimmten Reihenfolge, z.B. folgt Q2 nicht unbedingt Q1. Diese Dumps werden wöchentlich erstellt.

Dieses ist das empfohlene Format für Dumps. Bitte siehe die JSON-Struktur-Dokumentation für Informationen darüber, wie dort Wikidata-Entitäten dargestellt werden.

Hiweis: Jeder Datensatz (Objekt oder Eigenschaft) bekommt eine eigene Zeile in der JSON Datei, so dass die Datei Zeile für Zeile gelesen und jede Zeile separat als eigenständiges JSON-Objekt dekodiert werden kann.

Beachte, dass einige Dateien parallele Komprimierung nutzen, weshalb einige Dekomprimierer die Dateien nicht zuverlässig entpacken können. Wenn du Windows nutzt, kannst du z. B. Bzip2 verwenden.

JsonDumpReader ist eine PHP-Bibliothek zum Lesen der Dumps.

RDF Dumps

Erstens finden sich kanonische RDF-Dumps im Turtle-Format finden unter https://dumps.wikimedia.org/wikidatawiki/entities/. Das Mapping wird hier beschrieben. Diese vollständigen Datensätze werden mit all markiert.

Zweitens werde sogenannte truthy Dumps zur Verfügung gestellt. Sie benutzen das nt-Format. Sie sind im selben Format wie die vollständigen Dumps, aber beschränkt auf direkte, "truthy" Aussagen. Sie enthalten keine Metadaten wie Qualifier und Referenzen.

Die kompletten Dumps zusammen enthalten alle Information in Wikidata mit Ausnahme der Reihenfolge (der Alternativnamen, der Eigenschaften etc.), was in RDF normalerweise nicht dargestellt wird. Vereinfachte Dumps haben Aussagen, die keine Qualifikatoren als einzelne RDF-Tripel enthalten, Quellennachweise sind also weggelassen.

Die Dumps des Wikidata-Lexem-Namensraums im Turtle- und NTriples-Format können mit dem Suffix lexemes an der gleichen Stelle gefunden werden.

For details on the RDF dump format please see the page RDF Dump Format.

Partielle RDF-Dumps

WDumper ist ein Tool eines Drittanbieters zum Erstellen von benutzerdefinierten Wikidata-RDF-Dumbs. Datenobjekte und Aussagen können gefiltert werden.

XML dumps

Komplette XML dumps von Wikidata finden sich unter http://dumps.wikimedia.org/wikidatawiki.

Warnung: Das Format der JSON Daten, die eingebettet sind in die XML Dumps kann sich jederzeit ändern ohne dass dieses bekannt gemacht wird, und kann inkonsistent zwischen den Versionen sein. Es sollte als opake binäre Daten behandelt werden. Es wird stark empfohlen die JSON- oder RDF- Dumps zu verwenden, die eine festgelegte Darstellung der Daten bieten.

Es gibt ebenfalls inkrementelle Sicherungen von Wikidata zum Herunterladen. Diese Sicherungen enthalten alle Änderungen der letzten 24 Stunden. Dadurch ist es nicht notwendig, die komplette Sicherung herunter zu laden, zudem benötigen diese erheblich weniger Speicherplatz.

Sie können gefunden werden auf https://dumps.wikimedia.org/other/incr/wikidatawiki/.

Alte JSON- und RDF-Dumps

Alte RDF- und JSON-Dumps sind im Internet Archive (Q461) zu finden:

Datenmodell

Das Datenmodell kann hier eingesehen werden. Das Datenmodell beschreibt die grundlegenden Bausteine der Daten auf Wikidata.

Datenbankschema

Einen Überblick über das Schema der Datenbank findet sich auf dieser Seite. (Dieses ist nicht das Schema der Daten auf Wikidata.)

Lizenz

Wikidata stellt Kopien der verfügbaren Inhalte zum Herunterladen bereit. Diese Datenbanken können für privaten oder kommerziellen Nutzen sowie für backups oder offline genutzt werden. Alle strukturierten Daten des Haupt-, Eigenschaften-, Lexem- und EntitySchema-Namensraums sind unter der Creative Commons CC0 Lizenz verfügbar. Text in den anderen Namensräumen ist unter der Creative Commons Attribution/Share-Alike Lizenz Creative Commons Attribution/Share-Alike Lizenz verfügbar; weitere Lizenzen können beantragt werden. Medien und andere Inhalte sind unter verschiedenen Lizenzen verfügbar, wie es auf ihrer Beschreibungsseite angegeben ist.

Siehe auch