Help:O danych

This page is a translated version of the page Help:About data and the translation is 95% complete.
Outdated translations are marked like this.

Wikidane to wolna baza wiedzy, która może być czytana i edytowana zarówno przez ludzi, jak i przez maszyny. Jest tylko jednym z wielu opartych na wiki projektów prowadzonych i utrzymywanych przez Wikimedia Foundation, organizację nonprofit prawdopodobnie najlepiej znaną z Wikipedii. Każdy z projektów Wikimedia Foundation ma swój własny cel — na przykład, Wikipedia zbiera zawartość encyklopedyczną, Wikimedia Commons — obrazy i inne pliki multimedialne, Wikisłownik — informacje leksykalne o słowach, takie jak definicje czy synonimy. Celem Wikidanych jest zbieranie danych strukturalnych.

W zamierzeniu ta strona jest przeglądem danych strukturalnych. Jeśli już jesteś zaznajomiony z nimi, ale chcesz się dowiedzieć więcej o ich szczególnym zastosowaniu w Wikidanych, jak uzyskać dostęp do danych w Wikidanych, lub jak wprowadzić dane z własnego projektu do Wikidanych, przejdź do sekcji o linkowaniu danych.

Zrozumienie Wikidanych

Strukturalne dane odnoszą się do danych zorganizowanych i przechowywanych w zdefiniowany sposób, często z intencją zakodowania znaczenia i zachowania relacji między różnymi danymi w ich zbiorze.

Ale co to są dane? I dlaczego powinieneś się zainteresować danymi strukturalnymi?

Definiowanie danych

Big data, eksperymentalne dane, otwarte dane, meta dane - możesz napotkać niektóre, a nawet wszystkie te pojęcia.

Każde pojęcie znaczy coś nieco innego, ale wszystkie są zbudowane na wspólnym rozumieniu danych i potencjale do opisywania i poprawy rozumienia świata wokół nas.

Jako abstrakcyjne pojęcie, dane mogą być traktowane jako prekursor informacji, co oznacza, że informacje mogą być wywnioskowane lub pochodzić z danych.

Jest tak, ponieważ dane kiedy sprowadzane są w swej istocie do prostych "wartości" o "rzeczach". Te wartości mogą być ilościowe lub jakościowe, jak wymiary lub ilość. Wartości te mogą być liczbowe lub ilościowe jak wymiary lub ilość. Mogą to być również jakościowe, jak opis lub porównania. Na przykład, można powiedzieć, że "8848 m" to wartość danych o wysokości Mount Everest i że "czerwony" jest wartością danych o kolorze samochodu.

Jak poprzednio wymieniono, informacje to nie to samo co dane, ale są zamiast zbierania i analizy danych. Na przykład "8848" (dane) jest pozbawione sensu w surowej postaci, nawet jeśli wiemy, że jest to wysokość góry; Możemy powiedzieć, że "Mount Everest jest najwyższą górą na świecie, o wysokości 8848 ." (informacja), eśli jesteśmy świadomi standardów pomiaru wysokości i znamy wysokość innych gór. Staje się o wiele łatwiejsze wyciąganie wniosków, uzyskiwanie nowych informacji i wiedzy, i ustalić fakty, gdy dane są strukturalne - możemy wrócić do tego później.

Gdzie są dane?

Dane są wokół nas. Są różne rodzaje ich źródeł, włączając finansowe, biologiczne i społeczne. Nawet ta strona to dane! Na przykład, ma łączną liczbę słów, datę utworzenia i ostatniej modyfikacji, temat, liczbę odwiedzin i języki, w których zawartość jest dostępna.

Jednak, kiedy wszystko jest potencjalnie źródłem danych, dane niezapisane i niezoganizowane mogą równie dobrze nie istnieć. Bez podstawowej struktury, dane staną się bezsensowne i nie dostarczą przydatnych informacji.

Przez organizację, mamy na myśli kategoryzację w standardowy i jednoznaczny sposób. Organizacja i kategoryzacja danych jest tym, co dotyczy do tego, co nazywamy danymi strukturalnymi.

 
Wikidane oferują wejście do dodawania informacji do obiektów przez formularz.

Gdzie jest struktura?

W sieci panuje struktura. Większość stron internetowych jest tworzona przy użyciu języka HTML, języka znaczników, który zapewnia podstawową strukturę strony internetowej.

Języki opisowe są używane także do oznaczania i opisywania zawartości stron, więc wyszukiwarki, boty i aplikacje takie jak RSS potrafią je łatwo przetworzyć i "zrozumieć". Na przykład, tag <title> mówi maszynom o nazwie strony.

Zamiast wspierania struktury i wspólnych elementów stron, Wikidane umożliwiają uporządkowanie wszystkich informacji przechowywanych w Wikipedii i innych projektach Wikimedia. Wikidane wykorzystują oprogramowanie Mediawiki, tak jak każda inna wiki, dodatkowo przy użyciu Wikibase – oprogramowania napędzającego Wikidane i przeznaczonego do zarządzania dużą ilością ustrukturyzowanych danych. Struktura nie jest dodana wprost do zawartości Wikipedii i innych projektów w postaci tabel lub list, ani nie wymaga znajomości języków opisowych, schematów, zapisu czy innej specjalnej składni od użytkowników Wikidanych; zamiast tego dane dodaje się i edytuje w Wikidanych przez przyjazne użytkownikom formularze.

Wszystkie dane przechowywane w Wikidanych mogą być używane do tworzenia wszystkich rodzajów zautomatyzowanych i aktualnych list, tabel lub innych ustrukturyzowanych stron w dowolnym projekcie Wikimedia lub gdziekolwiek indziej.

Tabela 1
Dane dla gór
Góra Właściwość Wartość
Mount Everest height 8,848 m
K2 hauteur 8,611 m
Kanchenjunga height 8,586 m
Lhotse height 27940 ft

Strukturyzowanie danych

Aby zapoznać się z przykładem ważności struktury, spójrz na Tabelę 1. W niej możemy zobaczyć dane czterech najwyższych gór. Jeśli zechcemy poznać szczegółową wartość informacji, taką jak wysokość drugiej najwyższej góry na Ziemi, powinniśmy być w stanie spojrzeć na dostarczone dane i znaleźć prawidłową wartość. Jednak tylko trzy z czterech gór mają dane oznaczone jako wysokość. I tylko jedna z tych trzech ma wartość w metrach. Podczas gdy znamy wysokość i znaczenie słowa hauteur ("wysokość" po francusku) mogą być zrozumiane jako równe, i jak zamienić metry na stopy lub stopy na metry, maszyna taka jak bot czy komputer, może nie zrozumieć.

Byłoby łatwiej dla ludzi i maszyn przetwarzać informacje i zwracać oryginalny drugi najwyższy szczyt, gdyby wszystkie podstawowe dane były zapisane w ten sam sposób, nawet przy różnej prezentacji.

Modelowanie danych

Kolekcjonowane i strukturyzowane dane, jak Wikidane, mogą być zorganizowane według "modelu danych". Modele danych są odczytywalne przez maszyny tj. mogą być przez nie zrozumiane. Podczas gdy komputery są potężne, często nie są tak inteligentne jak my, jeśli chodzi o proste rozumowanie. W powyższym przykładzie, maszyna nie byłaby w stanie zrozumieć, że wysokość i hauteur jest tym samym, chyba że zostałoby to wyraźnie powiedziane jak w tym przypadku.

Tabela 2
Dane dla gór
Góra Właściwość Wartość
Mount Everest continent Asia
K2 continent Asia
Kanchenjunga continent Asia
Lhotse continent Asia
 

Modele danych są oparte na potrzebie analizy, zakresu, koncepcji szkieletu konstrukcji zbioru danych i wymagań technicznych systemu. Jednak wszystkie modele danych zwykle określają, jakie rodzaje danych są wspierane przez system i jakie relacje między wartościami mogą być zrozumiane i reprezentowane. Na przykład, model danych mógłby określić, że „wysokość” i „hauteur” są odwzorowaniem siebie nawzajem, więc oba pojęcia reprezentują jeden pomysł, czy że pomiary w stopach są automatycznie przekształca się w metry. Model danych Wikidanych kształtuje sposób, w jaki dane mogą być zmieniane i dodawane w systemie przez użytkowników. To również jest w toku, z nowymi typami danych dodawanymi do modelu w czasie.

Model danych istotnie tłumaczy ludzkie wzorce języka naturalnego w coś, co może być przetwarzane przez maszyny. Na przykład, możemy powiedzieć: Mount Everest to najwyższa góra na świecie. To jest surowy format bez struktury obecny na Wikipedii i innych witrynach Wikimedia.

W Wikidanych, to może być reprezentowane przez stwierdzenie, które składa się na parę właściwość-wartość o elemencie, w tym przypadku Ziemi:

Earth (Q2) (item)highest point (P610) (property)Mount Everest (Q513) (value)

W dodatku, Wikidane mogą utrzymywać stwierdzenia o elemencie Mount Everest (wskazując, że jest to góra):

Mount Everest (Q513) (item)instance of (P31) (property)mountain (Q8502) (value)

Należy pamiętać, że inne elementy mogą być użyte jako wartości deklaracji i wszystkie elementy mają swoją włąsną stronę na Wikidanych, to znaczy że wszystkie elementy w systemie mogą zostać połączone ze sobą za pomocą szeregu deklaracji. Ponieważ Wikidane wykorzystują format odczytywalny przez maszyny, te interlink danych pozwalają na odkrycie i przetwarzanie przez maszyny nowych relacji i połączeń. Na przykład, w tabeli 2. widzimy nowe dane o naszych górach, tym razem o ich lokalizacji (kontynenty), ale nie o wysokości. Zakładając, że dane o kontynentach są "połączone" z górą, możemy poczuć więcej pewności siebie, tworząc przewidywania lub wysnuwając wnioski, że Azja jest domem dla najwyższych gór.

Linkowanie danych

Poza tym, zbieranie danych strukturalnych obsługuje również "dane połączone". Związki danych odnoszą się do praktyk publikowania danych strukturalnych tak, że mogą być ze sobą powiązane.

Dla Wikidanych oznacza to, że zebrane tu dane mogą być także połączone z innymi zbiorami i bazami danych, źrółami danych z całego śwwiata i inicjatyw spoza rodziny Wikimedia. Na przykład, Wikidane pozwalają obecnie na łączenie zbiorów i baz danych takich jak Google Books, Canmore (jedna z królewskich komisji ds. starożytnych i historycznych zabytków Szkocji) Biblioteka Watykańska, OmegaWiki i MusicBrainz.

 
przykład prostej deklaracji składającej się z jednej pary właściwość-wartość
 
przykład bardziej rozbudowanej deklaracji Wikidanych zawierającej parę właściwość-wartość, kwalifikatory i źródło

Stosując zasady i praktyki połączonych danych, Wikidane są w stanie także wspierać i być używane przez inne projekty.

Zasady linkowania danych

Wikidane używają unikalnyh identyfikatorów uniform resource identifiers (URI) dla wszystkich elementów as per linked data standards.

Podczas gdy Wikidane używają unikalnego modelu danych, ich zawartość może być eksportowana do formatu RDF, powszechnie używanego standardu do opisu połączonych danych. W pojęciach Wikidanych, deklaracja jest zbudowana z elementu i pary właściwość-wartość. Dla zapoznanych z pojęciami połączonych danych element może być rozpatrywany jako element trójki danych; właściwość reprezentuje predykat tej trójki; wartość jest używana do wyrażania przedmiotu trójki.

Jednak, deklaracji Wikidanych mogą także zawierać elementy poza trójką przedmiot-predytak-obiekt, jak odnośniki czy kwalifikatory (Help:Statements). To komplikuje pełne reprezentowanie zawartości Wikidanych przy użyciu RDF - więcej informacji znajdziesz w: "Introducing Wikidata to the Linked Data Web".

Edycja danych

Jeśli masz zbiory danych, które chcesz włączyć do Wikidanych, zobacz Wikidata:Data donation.

Dostęp do danych

Dane Wikidanych są opublikowane na licencji:Creative Commons Public Domain Dedication 1.0, pozwalając na wolny użytek danych. Możesz je kopiować, modyfikować, dystrybuować, wykonywać, nawet do komercyjnych zastosowań - bez pytania o zgodę.

See Data access for details about the different ways to programmatically access Wikidata's data.

Zobacz też

Aby dowiedzieć się więcej, zobacz:

Aby uzyskać dodatkowe informacje i wskazówki, zobacz:

  • Chat, do omówienia wszystkich aspektów Wikidanych
  • Wikidata:Glossary, słowniczek terminów używanych na tej i innych stronach pomocy
  • Help:FAQ, często zadawane pytania i odpowiedzi na pytania społeczności Wikidanych
  • Help:Contents, portal pomocy zawierający całą dokumentację dostępną dla Wikidanych