Wikidata:Tutorial SPARQL

This page is a translated version of the page Wikidata:SPARQL tutorial and the translation is 98% complete.

Outdated translations are marked like this.

WDQS, il servizio di query di Wikidata, è un potente strumento per accedere ai contenuti di Wikidata. Questa guida ti insegnerà come usarlo. Leggi anche il tutorial interattivo di Wikimedia Israele

Before writing your own SPARQL query, look at {{Item documentation}} or any other generic SPARQL query template and see if your query is already included.

Prima di iniziare

Questa guida sembra molto lunga, forse addirittura intimidatoria. Per favore, non lasciare che ti spaventi! SPARQL è complicato, ma delle semplici basi già ti faranno fare molta strada – se vuoi, puoi smettere di leggere dopo #La nostra prima query, e ne saprai già abbastanza per scrivere molte query interessanti. Le sezioni successive aggiungono informazioni su questi argomenti che puoi usare per scrivere differenti query. Ognuna di esse ti darà la possibilità di scrivere query ancora più interessanti, ma nessuna di esse è indispensabile - puoi smettere di leggere in qualsiasi momento e avrai comunque utili informazioni!

Se non hai mai sentito prima parlare di Wikidata, SPARQL o WDQS, ecco una breve spiegazione di questi termini:

Wikidata è un database delle conoscenze. Contiene molte dichiarazioni come “la capitale del Canada è Ottawa”, o “La Gioconda è un dipinto a olio su tavola di legno di pioppo”, o “l'oro ha una capacità termica di 25 418 joule per mole-kelvin”.
SPARQL è un linguaggio per formulare domande (query) per i database delle conoscenze. Con il giusto database, una query SPARQL può rispondere a domande come “qual è la tonalità più popolare nella musica?” o “quale personaggio è stato interpretato dal maggior numero di attori?” o “qual è la distribuzione del tipo di sangue?” o “quali opere e di quali autori sono entrate nel pubblico dominio quest'anno?”.
WDQS, Wikidata Query Service, unisce i due insieme: tu immetti una query SPARQL, lui la esegue sul dataset di Wikidata e ti mostra il risultato.

SPARQL di base

Una semplice query SPARQL ha il seguente aspetto:

SELECT ?a ?b ?c
WHERE
{
  x y ?a.
  m n ?b.
  ?b f ?c.
}

La clausola SELECT elenca le variabili che si desidera vengano restituite (le variabili iniziano con un punto interrogativo), e la clausola WHERE contiene restrizioni su di esse, principalmente sotto forma di triple. Tutte le informazioni in Wikidata (e database delle conoscenze simili) sono memorizzate sotto forma di triple; quando si esegue la query, il servizio query prova a compilare le variabili con i valori effettivi in modo che le triple risultanti vengano visualizzate come nel database della conoscenza, e restituisce un risultato per ciascuna combinazione di variabili che trova.

Una tripla può essere letta come una frase (ecco perché termina con un punto), con un "soggetto", un "predicato" e un "oggetto":

SELECT ?frutto
WHERE
{
  ?frutto haColore giallo.
  ?frutto haSapore aspro.
}

I risultati per questa query potrebbero includere, ad esempio, "limone". In Wikidata, la maggior parte delle proprietà sono proprietà di tipo "ha", quindi la query si potrebbe leggere:

SELECT ?frutto
WHERE
{
  ?frutto colore giallo.
  ?frutto sapore aspro.
}

che si legge come “?frutto ha colore ‘giallo’” (non “?frutto è di colore ‘giallo’” – tienilo a mente per coppie di proprietà come “genitore”/“figlio”!).

Tuttavia, questo non è un buon esempio per WDQS. Il gusto è soggettivo, quindi Wikidata non ha una proprietà per questo. Invece, pensiamo alle relazioni genitori/figli, che sono per lo più non ambigue.

La nostra prima query

Supponiamo di voler elencare tutti i figli del compositore barocco Johann Sebastian Bach. Usando pseudo-elementi come nelle query precedenti, come scriveresti quella query?

Spero che tu abbia qualcosa del genere:

SELECT ?figlio
WHERE
{
  #  figlio "ha genitore" Bach
  ?figlio genitore Bach.
  # (nota: ogni cosa dopo un ‘#’ è un commento ed è ignorato da WDQS.)
}

o questo,

SELECT ?figlio
WHERE
{
  # figlio "ha padre" Bach 
  ?figlio padre Bach. 
}

o questo.

SELECT ?figlio
WHERE
{
  #  Bach "ha figlio" figlio
  Bach figlio ?figlio.
}

Le prime due triple dicono che il ?figlio deve avere come padre/genitore Bach; la terza dice che Bach deve avere il figlio ?figlio, Per ora esaminiamo il secondo.

Quindi, cosa rimane da fare per trasformare questo in una query WDQS corretta? Su Wikidata, gli oggetti e le proprietà non sono identificati da nomi leggibili dall'utente umano come "padre" (proprietà) o "Bach" (elemento). (Per una buona ragione: "Johann Sebastian Bach" è anche il nome di un pittore tedesco e Bach potrebbe anche riferirsi al cognome, al comune francese, al cratere di Mercurio, etc.) Invece, agli oggetti e alle proprietà di Wikidata viene assegnato un identificatore. Per trovare l'identificatore di un oggetto, cerchiamo l'elemento e copiamo il numero-Q del risultato che sembra sia l'elemento più simile a quello che stiamo cercando (in base alla descrizione, ad esempio). Per trovare l'identificatore di una proprietà, facciamo lo stesso, ma cerchiamo “P:termine cercato” invece che solo “termine cercato”, questo limita la ricerca solo alle proprietà. Questo ci dice che il famoso compositore Johann Sebastian Bach è Q1339, e la proprietà per designare il padre di un oggetto è P:P22.

E, ultimo ma non meno importante, abbiamo bisogno di includere dei prefissi. Per semplici triple WDQS, gli elementi devono essere preceduti da wd:, e le proprietà da wdt:. (Ma questo si applica solo ai valori fissi - le variabili non necessitano di un prefisso!)

Mettendo insieme tutto questo, arriviamo alla nostra prima query WDQS corretta:

SELECT ?figlio
WHERE
{
# ?figlio  padre   Bach
  ?figlio wdt:P22 wd:Q1339.
}

figlio	figlioLabel
wd:Q57225	Johann Christoph Friedrich Bach
wd:Q76428	Carl Philipp Emanuel Bach
…

linguaggio naturale	esempio	SPARQL	esempio
frase	Giulietta ama Romeo.	punto	`giulietta ama romeo.`
congiunzione (di intere frasi)	Romeo ama Giulietta e uccide se stesso.	punto e virgola	`romeo ama giulietta; uccide romeo.`
congiunzione (di singole parole)	Romeo uccide Tebaldo e se stesso.	virgola	`romeo uccide Tebaldo, romeo.`
proposizione relativa	Giulietta ama qualcuno che ha ucciso Tebaldo.	parentesi	`giulietta ama [ ucciso tebaldo ].`

Wikidata:Tutorial SPARQL

Prima di iniziare

SPARQL di base

La nostra prima query

Completamento automatico

Modelli di triple avanzate

Istanze e classi

Percorsi delle proprietà

Qualificatori

ORDER e LIMIT

Esercizio

Libri di Arthur Conan Doyle

Elementi chimici

Affluenti del Mississippi

Affluenti del Mississippi II

OPTIONAL

Espressioni, FILTER e BIND

Tipi di dati

Operatori

FILTER

BIND, BOUND, IF

COALESCE

Raggruppamento

Popolazioni delle città

Materiali per la pittura

Pistole per produttore

Editori per numero di pagine

HAVING

Riepilogo delle funzioni aggregatrici

wikibase:Label and aggregations

VALUES

E oltre…

Vedi anche

`ORDER` e `LIMIT`

`OPTIONAL`

Espressioni, `FILTER` e `BIND`

`FILTER`

`BIND`, `BOUND`, `IF`

`COALESCE`

`HAVING`

`VALUES`