Wikidata:SPARQL Tutorial

This page is a translated version of the page Wikidata:SPARQL tutorial and the translation is 99% complete.

Outdated translations are marked like this.

WDQS, der Wikidata Query Service, ist eine Anwendung, die dir viele Fragen beantworten kann. In diesem Tutorial lernst du, wie du den WDQS benutzen kannst. Siehe auch das interaktive Tutorial von Wikimedia Israel.

Sieh dir {{Item documentation}} oder eine andere generische SPARQL-Abfrage-Vorlage an, bevor du deine eigene SPARQL-Abfrage schreibst und schau nach, ob deine Abfrage dort bereits aufgenommen wurde.

Bevor wir beginnen

Dieser Leitfaden sieht sehr lang aus, vielleicht sogar erschreckend lang. Lass dich davon bitte nicht einschüchtern! SPARQL ist komplex, du kommst jedoch schon mit den Basics weit. Wenn du willst, kannst du nach #Unsere erste Abfrage aufhören weiterzulesen. Ab da weisst du genug, um viele interessante Abfragen selber zu schreiben. Jedes Kapitel danach ermöglicht es dir, noch tollere Abfragen zu verfassen. Du kannst aber auch jederzeit aufhören weiterzulesen und nimmst immer noch eine Menge nützliches Wissen mit!

Du hast noch nie von Wikidata, SPARQL oder WDQS gehört? Hier eine kurze Erklärung dieser Begriffe:

Wikidata ist eine Datenbank für Wissen. Sie enthält viele Angaben wie zum Beispiel „Die Hauptstadt von Kanada ist Ottawa” oder „Die Mona Lisa wurde mit Ölfarbe auf Pappelholz gemalt” oder „Gold hat eine Wärmeleitfähigkeit von 25,418 Joule pro Mol Kelvin”.
SPARQL ist eine Sprache, um Abfragen (Queries) für Wissensdatenbanken zu formulieren. Mit der richtigen Datenbank kann eine SPARQL-Abfrage Fragen wie “Was ist die beliebteste Tonart in der Musik?” oder “Welche Rolle wurde von den meisten Schauspielern gespielt?” oder “Wie ist die Verteilung von Blutgruppen?” oder “Welche Werke von Autoren sind in diesem Jahr frei zugänglich geworden?” beantworten.
WDQS, der Wikidata Query Service, bringt diese beiden Dinge zusammen: du gibst eine SPARQL-Abfrage ein, er startet eine Wikidata-Datenbankabfrage und zeigt dir das Resultat.

SPARQL Basics

Eine einfache SPARQL-Abfrage sieht so aus:

SELECT ?a ?b ?c
WHERE
{
  x y ?a.
  m n ?b.
  ?b f ?c.
}

Unter SELECT werden Variablen aufgelistet, welche du zurückgegeben willst (Variablen beginnen mit einem Fragezeichen) und unter WHERE sind die Variablen betreffende Begrenzungen aufgeführt, meistens in Form von Tripeln. Alle Informationen in Wikidata (und ähnlichen Wissensdatenbanken) sind in Tripeln gespeichert. Wenn du die Abfrage durchführst, versucht der Query Service die Variablen mit tatsächlichen Werten zu füllen, so dass der Tripel in der Wissensdatenbank vorkommt. Zurückgegeben wird dann ein Resultat für jede Kombination von Variablen, die gefunden wird.

Ein Tripel ist wie ein Satz aufgebaut: Er hat ein „Subjekt“, ein „Prädikat“ und ein „Objekt“. Und er hört mit einem Punkt auf.

SELECT ?frucht
WHERE
{
  ?frucht hatFarbe gelb.
  ?frucht schmeckt sauer.
}

Das Resultat dieser Abfrage könnte zum Beispiel “Zitrone” enthalten. In Wikidata sind die meisten Eigenschaften “hat”-Eigenschaften; die Abfrage sieht somit folgendermaßen aus:

SELECT ?frucht
WHERE
{
  ?frucht farbe gelb.
  ?frucht geschmack sauer.
}

...was sich folgendermaßen liest: “?frucht hat farbe ‘gelb’” (nicht “?frucht ist die Farbe von ‘gelb’”. Merk dir das für Eigenschafts-Paare wie “eltern”/“kind”!).

Wie auch immer, das ist kein gutes Beispiel für WDQS. Wikidata hat keine Eigenschaft für Geschmack, da dieser subjektiv ist. Lass uns stattdessen über Eltern/Kind Beziehungen nachdenken – diese sind meistens eindeutig.

Unsere erste Abfrage

Nehmen wir an, wir möchten alle Kinder vom Barock-Komponisten Johann Sebastian Bach auflisten. Wie sieht deine Abfrage aus, wenn du Pseudo-Elemente wie im Beispiel oben verwendest?

Vielleicht hast du etwas in dieser Art herausbekommen:

SELECT ?kind
WHERE
{
  #  kind "hat Elternteil" Bach
  ?kind elternteil Bach
  # (Hinweis: Alles nach einem ‘#’ ist ein Kommentar und wird vom WDQS ignoriert.)
}

oder das:

SELECT ?kind
WHERE
{
  # kind "hat Vater" Bach 
  ?kind vater Bach 
}

oder das:

SELECT ?kind
WHERE
{
  #  Bach "hat Kind" Kind
  Bach unterelement ?kind.
}

Die ersten beiden Tripel sagen: ?kind muss den Elternteil/Vater Bach haben; das dritte sagt, dass Bach das Unterelement ?kind haben muss. Lasst uns mit dem zweiten beginnen:

Also, was müssen wir noch machen, um eine korrekte WDQS-Abfrage zu schreiben? Auf Wikidata sind Objekte und Eigenschaften nicht mit für Menschen verständlichen Namen wie “Vater” (Eigenschaft) oder “Bach” (Gegenstand) bezeichnet. (Aus gutem Grund: “Johann Sebastian Bach” ist auch der Name eines Deutschen Malers und “Bach” könnte auch ein Vorname, eine Französische Gemeinde, ein Krater auf dem Merkur usw. sein.) Stattdessen teilt Wikidata jedem Objekt und jeder Eigenschaft einen Identifikator zu. Um den Identifikator eines Objekts zu finden, suchen wir das Objekt und kopieren die Q-Nummer des Resultates, welches uns passend erscheint (zum Beispiel aufgrund der Beschreibung). Um den Identifikator für eine Eigenschaft zu finden, machen wir das gleiche, suchen aber nach “P:Suchbegriff” statt nur “Suchbegriff”, was unsere Suche auf Eigenschaften beschränkt. Das sagt uns dann, dass der berühmte Komponist Johann Sebastian Bach Q1339 ist und die Eigenschaft, um den Vater eines Gegenstandes zu bestimmen, ist P:P22.

Nicht zuletzt müssen wir Präfixe einbinden. Für einfache WDQS-Dreiergruppen sollten Objekte das Präfix wd: bekommen und Eigenschaften das Präfix wdt: (Das betrifft nur feste Werte - Variablen bekommen kein Präfix)

Zusammenfassend kommen wir nun zu unserer ersten richtigen WDQS-Abfrage:

SELECT ?kind
WHERE
{
# ?kind vater Bach
  ?kind wdt:P22 wd:Q1339.
}

kind	kindLabel
wd:Q57225	Johann Christoph Friedrich Bach
wd:Q76428	Carl Philipp Emanuel Bach
…

gesprochene Sprache	Beispiel	SPARQL	Beispiel
Satz	Julia liebt Romeo.	Punkt	`julia liebt romeo.`
Konjunktion (Klausel)	Romeo liebt Julia und tötet sich selbst.	Semikolon	`romeo liebt julia; tötet romeo.`
Konjunktion (Substantiv)	Romeo tötet Tybalt und sich selbst.	Komma	`romeo tötet tybalt, romeo.`
Relativsatz	Julia liebt jemanden der tötet Tybalt.	Klammern	`julia liebt [ tötet tybalt ].`

Wikidata:SPARQL Tutorial

Bevor wir beginnen

SPARQL Basics

Unsere erste Abfrage

Autovervollständigung

Fortgeschrittene Tripelmuster

Instanzen und Klassen

Eigenschaftspfade

Qualifikatoren

ORDER und LIMIT

Übung

Bücher von Arthur Conan Doyle

Chemische Elemente

Flüsse, die in den Mississippi fließen

Flüsse, die in den Mississippi fließen II

OPTIONAL

Ausdrücke, FILTER und BIND

Datentypen

Operatoren

FILTER

BIND, BOUND, IF

COALESCE

Gruppierung

Einwohnerzahlen von Städten

Gemäldematerialien

Waffen nach Hersteller

Verlage nach Seitenanzahl

HAVING

Zusammenfassung der Aggregat-Funktionen

wikibase:Label und Aggregat

VALUES

Und darüber hinaus…

Siehe auch

`ORDER` und `LIMIT`

`OPTIONAL`

Ausdrücke, `FILTER` und `BIND`

`FILTER`

`BIND`, `BOUND`, `IF`

`COALESCE`

`HAVING`

`VALUES`