Bantuan:Tentang data

This page is a translated version of the page Help:About data and the translation is 98% complete.

Wikidata adalah basis data pengetahuan bebas yang dapat dibaca dan disunting baik oleh manusia maupun mesin. Wikidata adalah salah satu dari banyak proyek Wiki yang diinangkan dan dipelihara oleh Yayasan Wikimedia, sebuah organisasi nirlaba berkonten bebas yang terkenal dengan proyek Wikipedia. Setiap proyek di Yayasan Wikimedia memiliki fokus masing-masing, contohnya Wikipedia dengan konten ensiklopedisnya, Wikimedia Commons yang mendukung gambar dan beragam berkas media, dan Wiktionary yang menyedikan informasi leksikal tentang kata seperti penjabaran dan sinonimnya. Wikidata sendiri berfokus pada data terstruktur.

Halaman ini ditujukan sebagai sebuah gambaran data terstruktur. Apabila Anda sudah kenal dengan data terstruktur, tetapi ingin mempelajari lebih banyak mengenai penggunakan khusus di Wikidata, bagaimana mengakses data di Wikidata, atau bagaimana berkontribusi data dari proyek Anda sendiri ke Wikidata, silakan melompati ke bagian mengenai data terhubung.

Memahami Wikidata

Data terstruktur merujuk kepada data yang telah disusun dan disimpan dalam lokasi tertentu, sering pula ditujukan untuk menyandikan makna dan memelihara hubungan antara petunjuk data berbeda di dalam sebuah rangkaian data.

Apakah data itu sebenarnya? Dan mengapa Anda harus peduli dengan data terstruktur?

Mendefinisikan data

Data besar, data percobaan, data terbuka, data yang menjelaskan data lainnya—Anda mungkin telah mendengar terminologi tersebut sebelumnya.

Setiap istilah bermakna sesuatu yang sedikit berbeda namun semuanya dibangun pada pemahaman umum dari data dan berpotensi untuk menjelaskan dan mempertajam pemahaman kita mengenai dunia di sekeliling kita.

Sebagai pemahaman abstrak, data dapat dipahami sebagai perintis informasi, yang artinya informasi tersebut dapat disimpulkan atau berasal dari data.

Hal ini disebabkan ketika dirunut ke asalnya, data adalah sebuah rangkaian nilai tentang suatu benda. Nilai itu dan berupa angka atau kuantitatif seperti ukuran atau jumlah. Ia dapat berupa pula sebagai nilai kualitatif, seperti pemerian atau sebuah perbandingan. Seperti, kita dapat mengatakan bahwa "8.848 m (29.029 kaki)" adalah nilai data untuk ketinggian Gunung Everest dan "merah" adalah nilai data untuk warna sebuah mobil.

Seperti yang telah disebutkan sebelumnya, informasi tidak sama dengan data namun ia adalah hasil koleksi dan analisis data. Contohnya, 8.848 (data) adalah angka yang tidak memiliki makna tertentu untuk dirinya sendiri walaupun kita mengetahui bahwa ia merupakan tinggi sebuah gunung; kita hanya dapat mengatakan bahwa Gunung Everest merupakan gunung tertinggi di dunia pada 8.848 m (informasi) jika kita mengetahui pengukuran standar ketinggian dan ketika kita mengetahui tinggi gunung-gunung lain. Ia menjadi lebih mudah untuk membuat sebuah kesimpulan sedemikian rupa, menambah wawasan dan pengetahuan, dan membangun fakta-fakta ketika data tersebut disusun—kita akan kembali ke gagasan ini nanti.

Di mana data itu?

Data terdapat di sekeliling kita. Ada beberapa jenis sumber data, termasuk data keuangan, biologis, dan sosial. Bahkan halaman ini memiliki data di dalamnya! Contohnya, ia memiliki jumlah keseluruhan kata, tanggal pembuatan dan tanggal perubahan, sebuah topik dan tema, sejumlah angka berapa kali halaman tersebut telah ditampilkan, dan bahasa-bahasa di mana konten tersebut tersedia.

Namun, ketika semuanya menjadi sumber data yang potensial, data yang tidak terekam dan tersusun dapat juga tidak ada sama sekali. Tanpa struktur yang mendasarinya, data akan tampil tanpa arti dan tidak dapat menjadi informasi yang berguna.

Dengan menyusunnya, maksud kami adalah menggolongkan data tersebut dengan cara standar dan jelas. Data yang tersusun dan dikategorikan adalah apa yang kami rujuk ketika kami mengatakan data terstruktur.

 
Wikidata memiliki fitur masukan berbasis formulir untuk menambah data ke dalam butir-butir.

Di mana struktur itu?

Di web, struktur adalah raja. Sebagian besar situs-situs web dibuat dengan HTML, sebuah bahasa markah yang menyediakan fondasi dasar, atau struktur, dari sebuah halaman web.

Bahasa markah juga digunakan untuk menandai dan mendeskripsikan isi halaman sehingga mesin pencari, bot, dan aplikasi seperti umpan RSS dapat memproses dan "memahaminya" dengan mudah. Contohnya, tag <title> memberitahukan nama sebuah situs web kepada mesin-mesin.

Daripada mendukung struktur dan elemen umum dari sebuah halaman web, Wikidata menyediakan struktur untuk seluruh pengetahuan yang tersimpan di Wikipedia dan di proyek-proyek Wikimedia lain. Wikidata didasarkan pada perangkat lunak MediaWiki seperti Wiki lainnya, diperkaya dengan Wikibase, perangkat lunak yang menghidupi Wikidata dan dirancang untuk mengelola data terstruktur yang jumlahnya sangat besar. Struktur tidak langsung ditambahkan dalam isi Wikipedia atau halaman situs Wikimedia lain, seperti dalam daftar atau tabel, dan tidak pula membutuhkan pengetahuan tertentu mengenai bahasa markah, skema data, notasi objek, atau sintaksis khusus lainnya dari pengguna Wikidata; namun, data ditambahkan dan disunting ke Wikidata melalui formulir masukan yang ramah pengguna.

Seluruh data tersimpan di wikidata dapat digunakan untuk menghasilkan daftar atau tabel atau halaman struktur lainnya secara otomatis dan teranyar dalam situs Wikimedia atau dalam situs manapun.

Tabel 1
Data Gunung
Gunung Atribut Nilai
Mount Everest height 8,848 m
K2 hauteur 8,611 m
Kanchenjunga height 8,586 m
Lhotse height 27940 ft

Penyusunan data

Contoh pentingnya struktur, mari kita lihat Tabel 1. Dalam tabel tersebut kita dapat melihat data empat gunung tertinggi. Jika kita ingin mengetahui bagian tertentu dari informasi, seperti tinggi dari gunung tertinggi kedua di dunia, kita harus dapat melihat pada data yang tersedia dan mencari nilai yang benar. Namun, hanya tiga dari empat gunung tertinggi tersebut memiliki data yang dikelompokkan sebagai nilai tinggi, dan hanya dua dari tiga gunung tersebut memiliki nilai dalam satuan meter. Saat kita mengetahui bahwa tinggi dan hauteur (bahasa Perancis untuk tinggi) dapat dipahami sebagai nilai yang sama, sedangkan meter dan kaki dapat bertindak sebagai ukuran tinggi bagi keduanya, sebuah mesin seperti bot atau program komputer tidak dapat melakukannya.

Hal ini dapat memudahkan untuk manusia dan mesin untuk memproses informasi dan jawaban dari pertanyaan tentang gunung tertinggi kedua ketika seluruh data pokok direkam dengan cara yang sama bahkan jika penyajiannya berbeda.

Permodelan data

Koleksi dari data terstruktur, seperti Wikidata, disusun berdasarkan model data. Model data dapat dibaca oleh mesin, artinya data itu dapat dipahami oleh komputer. Komputer itu canggih, namun kadang-kadang ia tidak secerdas kita ketika menemui penalaran sederhana. Dalam contoh di atas, sebuah mesin mungkin saja tidak dapat menentukan tinggi dan hauteur memiliki makna yang sama, kecuali ia diberitahukan dengan cara tertentu.

Tabel 2
Data Gunung
Gunung Atribut Nilai
Mount Everest continent Asia
K2 continent Asia
Kanchenjunga continent Asia
Lhotse continent Asia
 

Model data berbeda-beda berdasarkan kebutuhan analisis, cakupan dan kerangka konseptual dari rangkaian data, dan syarat teknis dari sebuah sistem. Namun, seluruh model data umumnya akan menentukan jenis data apakah yang dapat didukung oleh sebuah sistem dan apakah hubungan antara nilai dapat dipahami dan diwakilkan. Sebagai contoh, sebuah model data dapat menentukan bahwa tinggi dan hauteur dipetakan kepada masing-masing sehingga istilah tersebut dapat mewakili satu konsep, atau ukurannya dalam satuan kaki dapat diubah secara otomatis ke dalam satuan meter. Model data Wikidata membentuk cara bahwa data dapat disunting dan ditambah ke dalam sistem oleh pengguna. Hal ini juga dalam pengerjaan, dengan jenis data baru akan ditambahkan ke model dari waktu ke waktu.

Model data pada dasarnya menerjemahkan pola bahasa alami manusia ke bentuk sesuatu yang dapat diolah oleh mesin. Contohnya, dalam bahasa Inggris kita dapat mengatakan:

Gunung Everest adalah gunung tertinggi di dunia

Ini merupakan format baku dan belum terstruktur dari sebuah konten dalam Wikipedia dan seluruh situs Wikimedia lainnya.

Pada Wikidata, ini dapat diwakili oleh sebuah pernyataan, yang terdiri atas satu pasang nilai-atribut tentang sebuah butir, dalam hal ini Bumi:

Earth (Q2) (butir)highest point (P610) (atribut)Mount Everest (Q513) (nilai)

Selain itu, Wikidata juga memegang pernyataan mengenai butir untuk Gunung Everest (menunjukkan hal itu adalah sebuah gunung):

Mount Everest (Q513) (butir)instance of (P31) (atribut)mountain (Q8502) (nilai)

Perhatikan bahwa karena butir lain dapat digunakan sebagai nilai dari pernyataan, dan seluruh butir memiliki halaman khusus di Wikidata, ini berarti seluruh butir dalam sistem dapat saling dihubungkan melalui serangkaian pernyataan. Karena Wikidata menggunakan format yang dapat dibaca oleh mesin, penautan data mengizinkan hubungan baru dan hubungan untuk diteemukan dan diproses oleh mesin. Contohnya, dalam Tabel 2 kita melihat data baru untuk gunung kita, kali ini mengenai lokasi geografis berdasarkan benua, tanpa informasi mengenai ketinggiannya. Dengan berasumsi bahwa data benua ini ditautkan ke data tinggi gunung tersebut, kita lebih yakin membuat prediksi atau membuat kesimpulan mengenai hal itu, seperti berkata bahwa Asia merupakan rumahnya bagi gunung tertinggi di dunia.

Data terhubung

Selain menjadi koleksi data terstruktur, Wikidata juga mendukung data terhubung. Data terhubung merujuk kepada praktik penerbitan data terstruktur sehingga ia dapat dihubungkan.

Bagi Wikidata ini berarti bahwa sukarelawan yang menyumbangkan data dapat menghubungkan data-data tersebut ke basis data lainnya, dan sumber data dari web dan upaya berbeda-beda di luar keluarga Wikimedia. Contohnya, Wikidata baru-baru ini mengizinkan adanya hubungan dengan rangkaian data dan basis data beragam seperti Google Books, Canmore (salah satu basis data Lingkungan Bersejarah Skotlandia), Vatican Library, OmegaWiki, dan MusicBrainz.

 
contoh dari pernyataan sederhana yang terdiri atas satu pasangan nilai-atribut
 
contoh dari pernyataan lebih rumit yang terdiri atas satu pasangan nilai-atribut, penjelas, dan sebuah referensi

Dengan mengikuti ketentuan dan praktik data terhubung, Wikidata juga dapat mendukung dan digunakan oleh proyek-proyek lainnya.

Kebijakan data terhubung

Wikidata menggunakan pengenal yang unik, atau pengenal sumber seragam (URI), karena seluruh butir-butirnya sesuai standar data terhubung.

Karena Wikidata menggunakan model data yang berbeda, isinya dapat diekspor ke dalam bentuk RDF, format standar dan banyak digunakan untuk data terhubung. Dalam istilah Wikidata, sebuah pernyataan tersusun atas satu butir dan nilai-atribut yang saling berpasangan. Untuk mereka yang telah mengenal konsep data terhubung, sebuah butir dan dilihat sebagai bagian subjek dari kembar tiga; atributnya mewakili sebuah predikat kembar tiga; dan sebuah nilai digunakan untuk menyatakan objek dari sebuah kembar tiga.

Namun, pernyataan-pernyataan Wikidata mungkin dapat mengandung elemen-elemen di luar subjek-predikat-objek, seperti referensi dan penjelas (untuk informasi lengkap, lihat Help:Statements). Hal ini menyulitkan dalam mewakili isi Wikidata secara utuh dengan menggunakan bahasa RDF—informasi lain mengenai tantangan ini dapat ditemui dalam dokumen "Mengenal Wikidata ke Linked Data Web".

Menyumbang data

Apabila Anda memiliki himpunan data yang ingin disumbangkan ke Wikidata, silakan lihat Wikidata:Data donation.

Mengakses data

Data di Wikidata diterbitkan di bawah Creative Commons Public Domain Dedication 1.0, mengizinkan penggunaan ulang data secara bebas. Anda dapat menyalin, mengubah, menyebarluaskan dan mempertontonkan data tersebut, bahkan untuk tujuan komersial, tanpa harus meminta izin.

See Data access for details about the different ways to programmatically access Wikidata's data.

Lihat pula

Untuk halaman terkait, lihat:

Untuk informasi tambahan dan petunjuk, lihat:

  • Warung kopi, untuk mendiskusikan semua dan setiap aspek Wikidata
  • Wikidata:Glossary, glosarium istilah yang digunakan dalam halaman ini dan halaman Bantuan lain
  • Help:FAQ, pertanyaan yang sering ditanyakan dan jawaban oleh komunitas Wikidata
  • Help:Contents, portal Bantuan yang menyediakan seluruh dokumentasi yang tersedia untuk Wikidata