Wikidata:tutorial SPARQL

This page is a translated version of the page Wikidata:SPARQL tutorial and the translation is 97% complete.

Outdated translations are marked like this.

WDQS, Wikidata Query Service, es una herramienta poderosa para proporcionar información sobre el contenido de Wikidata. Esta guía te enseñará cómo usarla. Mira también el tutorial interactivo de Wikimedia Israel.

Before writing your own SPARQL query, look at {{Item documentation}} or any other generic SPARQL query template and see if your query is already included.

Antes de comenzar

Si bien esta guía puede parecer muy larga e intimidante, ¡no dejes que eso te asuste! El solo hecho de aprender los conceptos básicos de SPARQL te llevará lejos, incluso si dejas de leer después de #Nuestra primera query ya sabrás lo suficiente como para construir muchas consultas interesantes. Cada sección de este tutorial te permitirá crear consultas aún más complejas.

Si nunca has oído hablar de Wikidata, SPARQL, o WDQS antes, aquí una breve explicación de estos términos:

Wikidata es una base de datos de conocimiento. Contiene muchas declaraciones como "la capital de Canadá es Ottawa", o "la Mona Lisa está pintada al óleo sobre madera de álamo", o "el oro tiene un punto de fusión de 1,064.18 grados Celsius".
SPARQL es un lenguaje para formular preguntas (consultas) para bases de datos de conocimiento. Con la base de datos adecuada, una consulta SPARQL podría responder a preguntas como "¿cuál es la tonalidad más popular en la música?" o "¿qué personaje fue representado por la mayoría de los actores? o "¿cuál es la distribución de los tipos de sangre? o "¿qué obras pasaron a ser de dominio público este año?"
WDQS, el servicio de consulta de Wikidata, reúne ambas funciones: si escribes una consulta SPARQL, la ejecuta contra el conjunto de datos de Wikidata y te muestra el resultado.

Conceptos básicos de SPARQL

Una consulta SPARQL sencilla tiene este aspecto:

SELECT ?a ?b ?c
WHERE
{
  x y ?a.
  m n ?b.
  ?b f ?c.
}

La cláusula SELECT enumera las variables que deseas que se respondan (las variables comienzan con un signo de interrogación), y la cláusula WHERE contiene las restricciones, principalmente en forma de ternas. Toda la información en Wikidata (y bases de datos de conocimiento similares) se almacena en forma de terna; cuando se ejecuta una consulta, el servicio de consulta intenta completar las variables con valores reales para que las ternas resultantes aparezcan en la base de datos de conocimiento, y devuelve un resultado para cada combinación de variables que encuentra.

Una terna se puede leer como una oración (por eso termina con un punto), con un "sujeto", un "predicado" y un "objeto":

SELECT ?fruta
WHERE
{
  
?fruta tieneColor amarillo.
  ?fruta gusto agrio.
}

Los resultados para esta consulta podrían incluir, por ejemplo, “limón”. En Wikidata, la mayoría de las propiedades se pueden leer como propiedades que comienzan con “tiene”, así que la consulta podría ser en su lugar:

SELECT 
?fruta
WHERE
{
  
?fruta color amarillo.
  ?fruta gusto agrio.
}

Lo cual se lee “?fruta tiene color ‘amarillo’” (no como “?fruta es de color ‘amarillo’” – ten esto en cuenta para los pares de propiedades como "padre" / "niño"!).

Sin embargo, ese no es un buen ejemplo para WDQS. El gusto es subjetivo, por lo que Wikidata no tiene una propiedad para ello. En su lugar, pensemos en las relaciones entre padres e hijos, que en su mayoría son inequívocas.

Nuestra primera query

Supongamos que queremos enumerar a todos los hijos del compositor barroco Johann Sebastian Bach. Usando pseudo-elementos como en las consultas anteriores, ¿cómo escribirías esa consulta?

Esperemos que tengas algo como esto:

SELECT ?hijo
WHERE
{
  #  hijo "tiene padre" Bach
  ?hijo padre Bach.
  # (Nota: todo lo que se escribe después de un '#' es un comentario y es ignorado por WDQS.)
}

O esto,

SELECT ?hijo
WHERE
{
  # hijo "tiene padre" Bach 
  ?hijo papá Bach. 
}

o esto,

SELECT ?hijo
WHERE
{
  #  Bach "tiene hijo" hijo
  
Bach hijo ?hijo.
}

Las primeras dos ternas dicen que el ?hijo debe tener el padre Bach; el tercero dice que Bach debe tener el hijo ?hijo. Vayamos con el segundo por ahora.

Entonces, ¿qué queda por hacer para convertir esto en una consulta WDQS adecuada? En Wikidata, los elementos y las propiedades no se identifican con nombres legibles como "padre" (propiedad) o "Bach" (elemento). (Por una buena razón: "Johann Sebastian Bach" es también el nombre del pintor alemán, y "Bach" también puede referirse al apellido, o a la comuna francesa, o a cráter en Mercurio, etc.) En vez de nombres, a los elementos y propiedades de Wikidata se les asigna un identificador. Para encontrar el identificador de un elemento, buscamos el elemento y copiamos el número "Q" que corresponde al elemento que buscamos (lo podés identificar a partir de la descripción, por ejemplo). Para encontrar el identificador de una propiedad, hacemos lo mismo, pero buscamos "P: término de búsqueda" en lugar de solo el "término de búsqueda", lo que limita la búsqueda a las propiedades. Esto nos dice que el famoso compositor Johann Sebastian Bach es la Q1339, y la propiedad para designar al padre de un elemento es la P:P22.

Por último pero no menos importante, necesitamos incluir los prefijos. Para las consultas de ternas simples, los items deberían tener como prefijo wd:, y las propiedades wdt:. (Esto solo aplica a valores fijos - las variables no tienen un prefijo)

Juntando esto, llegamos a nuestra primera consulta WDQS:

SELECT ?hijo
WHERE
{
# ?hijo padre Bach
  ?hijo wdt:P22 wd:Q1339.
}

hijo	hijoLabel
wd:Q57225	Johann Christoph Friedrich Bach
wd:Q76428	Carl Philipp Emanuel Bach
…

Lengua natural	ejemplo	SPARQL	ejemplo
oración	Julieta ama Romeo.	Punto	`Julieta ama Romeo '.'`
Conjunción (cláusula)	Romeo ama Julieta 'y' se mata .	Punto y coma	`Romeo ama Julieta ; mata Romeo.`
Conjunción (sustantivo)	Romeo mata Tybalt 'y' él mismo.	Coma	`Romeo mata tybalt, Romeo.`
Cláusula relativa	Julieta ama a alguien quien mata Tybalt.	Corchetes	`Julieta ama [ mata Tybalt ].`

Wikidata:tutorial SPARQL

Antes de comenzar

Conceptos básicos de SPARQL

Nuestra primera query

Autocompletado

Funciones avanzadas

Instancias y clases

Propiedades y rutas

Calificadores

ORDER y LIMIT

Ejercicios

Libros de Arthur Conan Doyle

Elementos químicos

Ríos que desembocan en el Mississippi

Ríos que desembocan en el Mississippi II

OPCIONAL

Expresiones, FILTER y BIND

Tipos de datos

Operadores

FILTER

BIND, BOUND, IF

COALESCE

Agrupación

Poblaciones de ciudades

Materiales de pintura

Armas por fabricante

Editores por cantidad de páginas

HAVING

Sumario de las funciones agregación

wikibase:Label and aggregations

VALUES

Y más allá…

Véase también

`ORDER` y `LIMIT`

`OPCIONAL`

Expresiones, `FILTER` y `BIND`

`FILTER`

`BIND`, `BOUND`, `IF`

`COALESCE`

`HAVING`

`VALUES`