Вікідані:Підручник із SPARQL

This page is a translated version of the page Wikidata:SPARQL tutorial and the translation is 24% complete.

Outdated translations are marked like this.

WDQS, Wikidata Query Service (Служба запитів Вікіданих) – це потужний інструмент для надання інформації про вміст Вікіданих. Цей підручник навчить вас, як користуватися WDQS. Див. також інтерактивний підручник від Wikimedia Israel.

Перш ніж писати свій власний запит SPARQL, подивіться {{Item documentation}} або будь-який інший типовий шаблон запиту SPARQL і подивіться, чи ваш запит уже включено.

Перед тим, як почати

Хоча цей посібник може виглядати дуже довгим і складним, будь ласка, не дозволяйте цьому лякати вас! Просто вивчивши основи SPARQL, ви пройдете довгий шлях - навіть якщо ви перестанете читати після нашого першого запиту, ви вже зрозумієте достатньо, щоб створити багато цікавих запитів. Кожен розділ цього підручника дозволить вам писати ще потужніші запити.

Якщо ви ніколи раніше не чули про Вікідані, SPARQL або WDQS, ось коротке пояснення цих термінів:

Вікідані – це база даних знань. Вона містить мільйони тверджень, наприклад, «столиця Канади — Оттава», «Мона Ліза намальована олійною фарбою на дереві тополі», або «золото має температуру плавлення 1064,18 градуса за Цельсієм».
SPARQL – це мова для формулювання питань (запитів) до баз даних знань. Для правильної бази даних запит SPARQL міг би відповісти на такі запитання, як "яка найпопулярніша тональність у музиці?" або "який персонаж був зображений більшістю акторів?" або "який розподіл груп крові?" або "роботи яких авторів перейшли у суспільне надбання цього року?".
WDQS, служба запитів Вікіданих, об’єднує їх разом: ви вводите запит SPARQL, служба запускає його з набором даних Вікіданих та показує вам результат.

Основи SPARQL

Простий запит SPARQL виглядає так:

SELECT ?a ?b ?c
WHERE
{
  x y ?a.
  m n ?b.
  ?b f ?c.
}

Пункт SELECT перераховує змінні, які ви хочете повернути (змінні починаються із знака питання), а пункт WHERE містить обмеження на них, переважно у формі триплетів. Уся інформація у Вікіданих (і аналогічних базах даних знань) зберігається у вигляді триплетів; коли ви запускаєте запит, служба запитів намагається заповнити змінні фактичними значеннями, так, як отримані триплети з'являються в базі знань, і повертає один результат для кожної комбінації змінних, які вона знаходить.

Триплет можна розглядати як дві вершини (псевдоніми — два вузли, два ресурси), з’єднані ребром (дугою, властивістю) всередині величезного орієнтованого (спрямованого) мультиграфа властивостей, який утворює Вікідані. Його можна читати як речення (тому він закінчується крапкою), з суб'єктом (підметом, subject), предикатом (присудком, predicate) і об'єктом (додатком, object):

SELECT ?fruit
WHERE
{
  ?fruit hasColor yellow.
  ?fruit tastes sour.
}

Результати для цього запиту можуть включати, наприклад, «лимон». У Вікіданих більшість властивостей є властивостями типу «має» («has»), тому запит можна читати навпаки:

SELECT ?fruit
WHERE
{
  ?fruit color yellow.
  ?fruit taste sour.
}

який читається як «?fruit має колір 'yellow'» (не «?fruit є колір 'yellow'» – майте це на увазі для таких пар властивостей, як «батько»/«дитина»!).

Однак це не дуже хороший приклад для WDQS. Смак суб’єктивний, тому Вікідані не мають властивостей для нього. Натомість давайте подумаємо про відношення між батьками та дітьми, які переважно однозначні.

Наш перший запит

Припустимо, ми хочемо скласти список усіх дітей барокового композитора Йоганна Себастьяна Баха. Використовуючи псевдоелементи, як у запитах вище, як би ви написали цей запит?

Сподіваємось, у вас є щось на зразок цього:

SELECT ?child
WHERE
{
  #  child "has parent" Bach
  ?child parent Bach.
  # (примітка: все після ‘#’ є коментарем й ігнорується у WDQS.)
}

або цього

SELECT ?child
WHERE
{
  # child "has father" Bach 
  ?child father Bach. 
}

або цього

SELECT ?child
WHERE
{
  #  Bach "has child" child
  Bach child ?child.
}

The first two triples say that the ?child must have the parent/father Bach; the third says that Bach must have the child ?child. Let’s go with the second one for now.

So what remains to be done in order to turn this into a proper WDQS query? On Wikidata, items and properties are not identified by human-readable names like “father” (property) or “Bach” (item). (For good reason: “Johann Sebastian Bach” is also the name of a German painter, and “Bach” might also refer to the surname, the French commune, the Mercury crater, etc.) Instead, Wikidata items and properties are assigned an identifier. To find the identifier for an item, we search for the item and copy the Q-number of the result that sounds like it’s the item we’re looking for (based on the description, for example). To find the identifier for a property, we do the same, but search for “P:search term” instead of just “search term”, which limits the search to properties. This tells us that the famous composer Johann Sebastian Bach is Q1339, and the property to designate an item’s father is P:P22.

And last but not least, we need to include prefixes. For simple WDQS triples, items should be prefixed with wd:, and properties with wdt:. (But this only applies to fixed values – variables don’t get a prefix!)

Putting this together, we arrive at our first proper WDQS query:

SELECT ?child
WHERE
{
# ?child  father   Bach
  ?child wdt:P22 wd:Q1339.
}

child	childLabel
wd:Q57225	Johann Christoph Friedrich Bach
wd:Q76428	Carl Philipp Emanuel Bach
…

natural language	example	SPARQL	example
sentence	Juliet loves Romeo.	period	`juliet loves romeo.`
conjunction (clause)	Romeo loves Juliet and kills himself.	semicolon	`romeo loves juliet; kills romeo.`
conjunction (noun)	Romeo kills Tybalt and himself.	comma	`romeo kills tybalt, romeo.`
relative clause	Juliet loves someone who kills Tybalt.	brackets	`juliet loves [ kills tybalt ].`

Вікідані:Підручник із SPARQL

Перед тим, як почати

Основи SPARQL

Наш перший запит

Автозавершення

Удосконалені схеми триплетів

Екземпляри й класи

Шляхи властивостей

Кваліфікатори

ORDER і LIMIT

Вправа

Книги Артура Конана Дойла

Хімічні елементи

Річки, що впадають у Міссісіпі

Річки, що впадають у Міссісіпі II

OPTIONAL

Вирази, FILTER і BIND

Типи даних

Оператори

FILTER

BIND, BOUND, IF

COALESCE

Групування

Міське населення

Матеріал для картин

Вогнепальна зброя за виробником

Видавці за кількістю сторінок

HAVING

Огляд агрегатних функцій

wikibase:Назви й агрегації

VALUES

А далі…

Див. також

`ORDER` і `LIMIT`

`OPTIONAL`

Вирази, `FILTER` і `BIND`

`FILTER`

`BIND`, `BOUND`, `IF`

`COALESCE`

`HAVING`

`VALUES`