Wikidata:SPARQL tutorial/nl

This page is a translated version of the page Wikidata:SPARQL tutorial and the translation is 100% complete.

WDQS, de Wikidata Query Service, is een krachtig hulpmiddel om inzicht te krijgen in de inhoud van Wikidata. Deze handleiding zal u leren hoe u het moet gebruiken. Zie ook de interactive tutorial gemaakt door Wikimedia Israël.

Voordat u uw eigen SPARQL-query schrijft, kijk dan naar {{Item documentation}} of een andere generische SPARQL-query sjabloon en kijk of uw query al is toegevoegd.

Voordat we beginnen

Hoewel deze tutorial misschien heel lang en intimiderend lijkt, laat u daar niet door afschrikken. Alleen het leren van de SPARQL-basis zal u ver op weg helpen - zelfs als u na #Onze eerste query stopt te lezen, zult u al meer begrijpen om veel interessante queries te bouwen. Elk deel van deze tutorial zal u in staat stellen die query nog krachtiger te maken.

Als u nog nooit van Wikidata, SPARQL of WDQS hebt gehoord, is hier een korte uitleg van die termen:

Wikidata is een kennisdatabase. Het bevat miljoenen verklaringen, zoals "de hoofdstad van Canada is Ottawa", of "de Mona Lisa is in olieverf op populierenhout geschilderd", of "goud smelt op 1.064,18 graden Celsius".
SPARQL is een taal voor het formuleren van een query (of meerdere queries) voor kennisdatabases. Met de juiste database kan een SPARQL-navraag vragen beantwoorden als "wat is de meest populaire toon in muziek?" of "welk personage werd door de meeste acteurs afgebeeld?" of "wat is de verdeling van bloedgroepen?" of welke werken van auteurs zijn dit jaar in het publieke domein gekomen?
WDQS, de Wikidata Query Service, brengt de twee samen: u voert een SPARQL-query in, het wordt uitgevoerd op de dataset van Wikidata en laat het resultaat zien.

SPARQL basis

Een eenvoudige SPARQL-query kan er zo uitzien:

SELECT ?a ?b ?c
WHERE
{
  x y ?a.
  m n ?b.
  ?b f ?c.
}

De SELECT clause geeft de variabele aan die u wilt opvragen (elke variabele begint met een vraagteken), en de WHERE clause bevat de beperkingen, meestal in de vorm van tripels. Alle informatie in Wikidata (en vergelijkbare kennisdatabases) wordt opgeslagen in de vorm van tripels; Wanneer u de query uitvoert, probeert de queryservice de variabelen in te vullen met werkelijke waarden, zodat de resulterende triples worden weergegeven in de kennisdatabase en één resultaat retourneert voor elke combinatie van variabelen die wordt gevonden.

Een tripel kan worden gezien als twee hoekpunten (alias 2 knooppunten, 2 bronnen) verbonden door een rand (een boog, een eigenschap) binnen de gerichte (georiënteerde) eigenschapsmultigraaf die Wikidata vormt. Het kan worden gelezen als een zin (daarom eindigt het met een punt), met een onderwerp, een predicaat en een object:

SELECT ?fruit
WHERE
{
  ?fruit hasColor yellow.
  ?fruit tastes sour.
}

Het resultaat van deze query kan bijvoorbeeld "lemon" bevatten. In Wikidata zijn de meeste eigenschappen eigenschappen van het soort "has", dus de query kan in plaats daarvan luiden:

SELECT ?fruit
WHERE
{
  ?fruit color yellow.
  ?fruit taste sour.
}

wat leest als “?fruit heeft kleur ‘geel’” (niet “?fruit is de kleur van ‘geel’” – denk hieraan voor eigenschapsparen als “parent”/“child”!)

Dat is echter geen goed voorbeeld voor WDQS. Smaak is subjectief, dus Wikidata heeft er geen eigenschap voor. Laten we in plaats daarvan eens nadenken over parent/child-relaties, die meestal ondubbelzinnig zijn.

Onze eerste query

Stel dat we alle kinderen van de barokcomponist Johann Sebastian Bach willen opnemen. Met pseudo-elementen zoals in de vragen hierboven, hoe zou u die query schrijven?

Hopelijk heeft u iets als dit:

SELECT ?child
WHERE
{
  #  child "has parent" Bach
  ?child parent Bach.
  # (NB: alles na een '#' is een commentaar en wordt door WDQS genegeerd. )
}

of dit,

SELECT ?child
WHERE
{
  # child "has father" Bach 
  ?child father Bach. 
}

of dit,

SELECT ?child
WHERE
{
  #  Bach "has child" child
  Bach child ?child.
}

De eerste twee tripels zeggen dat het kind als ouder/vader Bach moet hebben; de derde zegt dat Bach het kind het kind moet hebben. Laten we nu de tweede nemen.

Wat moet er dan nog gedaan worden om dit in een goede WDQS-vraag te veranderen? Op Wikidata worden items en eigenschappen niet geïdentificeerd door door menselijk leesbare namen zoals "vader" (eigendom) of "Bach" (item). (Met goede reden: "Johann Sebastian Bach" is ook de naam van een Duitse schilder, en "Bach" kan ook verwijzen naar de achternaam, de Franse commune, de Mercuriuskrater, enz. ) In plaats daarvan wordt aan Wikidata-artikelen en eigenschappen een identificatiecode toegewezen. de identificator voor een item we zoeken naar het item en kopiëren het Q-nummer van het resultaat dat klinkt alsof het het item is dat we zoeken (gebaseerd op de beschrijving, bijvoorbeeld). Om de identificatiecode voor een eigenschap te vinden, doen we hetzelfde, maar zoeken we naar "P:zoekterm" in plaats van gewoon "zoekterm", wat de zoekopdracht beperkt tot eigenschappen. Dit vertelt ons dat de beroemde componist Johann Sebastian Bach Q1339 is, en de eigenschap om de vader van een item te vinden P:P22 is.

En last but not least, we moeten voorvoegsels toevoegen. Voor eenvoudige WDQS-tripels moeten de items worden voorafgegaan metwd:, en de eigenschappen met wdt:. (Maar dit geldt alleen voor vaste waarden - variabelen krijgen geen prefix!)

Samengevat wordt onze eerste WDQS-query:

SELECT ?child
WHERE
{
# ?child  father   Bach
  ?child wdt:P22 wd:Q1339.
}

child	childLabel
wd:Q57225	Johann Christoph Friedrich Bach
wd:Q76428	Carl Philipp Emanuel Bach
…

natuurlijke taal	voorbeeld	SPARQL	voorbeeld
zin	Juliet loves Romeo.	punt	`juliet loves romeo.`
conjunctie (clause)	Romeo loves Juliet and kills himself.	puntkomma	`romeo loves juliet; kills romeo.`
conjunctie (zelfstandig naamwoord)	Romeo kills Tybalt and himself.	komma	`romeo kills tybalt, romeo.`
relatieve clausule	Juliet loves someone who kills Tybalt.	haakjes	`juliet loves [ kills tybalt ].`

Wikidata:SPARQL tutorial/nl

Voordat we beginnen

SPARQL basis

Onze eerste query

Automatisch aanvullen

Geavanceerde tripel patronen

Instanties en classes

Eigenschapspaden

Kwalificaties

ORDER en LIMIT

Oefening

Arthur Conan Doyle boeken

Chemische elementen

Rivers die in de Mississippi stromen

Rivers die in de Mississippi stromen II

OPTIONAL

Expressies, FILTER en BIND

Gegevenstypes

Operatoren

FILTER

BIND, BOUND, IF

COALESCE

Groeperen

Bevolking van steden

Schildersmaterialen

Wapens per fabrikant

Uitgevers per aantal pagina's

HAVING

Samenvatting van aggregatie functies

wikibase:Label en aggregaties

VALUES

En verder...

Zie ook

`ORDER` en `LIMIT`

`OPTIONAL`

Expressies, `FILTER` en `BIND`

`FILTER`

`BIND`, `BOUND`, `IF`

`COALESCE`

`HAVING`

`VALUES`