This page is a translated version of the page Wikidata:Data access and the translation is 93% complete.

Wikidata saat ini berisi lebih dari 100 juta Item dan lebih dari 650.000 Leksem, dan jumlah ini akan terus bertambah. Ada banyak metode yang tersedia untuk mengakses semua data itu -- dokumen ini menjabarkannya dan membantu calon pengguna memilih metode terbaik yang sesuai dengan kebutuhan mereka.

Sangatlah penting untuk memilih metode akses yang memberimu data yang Anda perlukan dengan cara tercepat, paling efisien sambil tidak memuat beban yang tidak perlu di Wikidata; halaman ini adalah untuk membantumu melakukan hal itu.

Sebelum kita mulai

Menggunakan data di Wikidata

 
Logo kami

Wikidata menawarkan berbagai macam data umum tentang segala sesuatu di bawah matahari. Semua data itu dilisensikan CC0, "No rights reserved", untuk domain publik.

Perubahan pada API dan metode lain untuk mengakses Wikidata tunduk pada Kebijakan Antarmuka Stabil. Sumber data pada halaman ini tidak dijamin menjadi antarmuka yang stabil.

Proyek-Proyek Wikimedia

Dokumen ini tentang mengakses data dari luar proyek Wikimedia. Jika Anda perlu menampilkan data dari Wikidata dalam proyek Wikimedia lainnya, di mana Anda dapat menggunakan fungsi parser, Lua dan/atau metode khusus internal lainnya, lihat Cara menggunakan data di proyek Wikimedia.

Pengalaman terbaik data

 
Sukarelawan seperti orang-orang ini – dan Anda – adalah yang membangun Wikidata

Kami menawarkan data di Wikidata secara bebas dan tanpa persyaratan atribusi di bawah CC-0. Sebagai imbalannya, kami akan sangat menghargai jika, dalam proyek Anda, Anda menyebut Wikidata sebagai asal data Anda. Dengan melakukan itu, Anda membantu memastikan bahwa Wikidata akan bertahan lama untuk menyediakan data terkini dan berkualitas tinggi. Kami juga mempromosikan proyek terbaik yang menggunakan data Wikidata.

Beberapa contoh untuk mengatribusikan Wikidata: "Powered by Wikidata" ("Didukung oleh Wikidata"), "Powered by Wikidata data" ("Didukung oleh data Wikidata"), "Powered by the magic of Wikidata" ("Didukung oleh keajaiban Wikidata"), "Using Wikidata data" ("Menggunakan data Wikidata"), "With data from Wikidata" ("Dengan data dari Wikidata"), "Data from Wikidata" ("Data dari Wikidata"), "Source: Wikidata" ("Sumber: Wikidata"), "Including data from Wikidata" ("Termasuk data dari Wikidata") dan sebagainya. Anda juga dapat menggunakan salah satu dari file siap pakai.

Anda boleh menggunakan logo Wikidata yang ditunjukkan di atas, tetapi dengan melakukan itu Anda tidak boleh menyiratkan dukungan oleh Wikidata atau oleh Yayasan Wikimedia dengan cara apa pun.

Harap tawarkan kepada pengguna Anda cara untuk melaporkan masalah dalam data, dan temukan cara untuk memberi masukan ini kembali ke komunitas editor Wikidata, misalnya melalui Pencari Ketidakcocokan. Harap bagikan lokasi tempat Anda mengumpulkan masalah ini di Obrolan proyek.

Pengalaman terbaik mengakses

Ketika mengakses data Wikidata, amati pengalaman terbaik berikut:

  • Ikuti kebijakan Agen-Pengguna -- kirimkan tajuk Agen-Pengguna yang baik.
  • Ikuti kebijakan robot: kirim Accept-Encoding: gzip,deflate dan jangan membuat terlalu banyak permintaan sekaligus.
  • Jika Anda mendapatkan respon 429 Too Many Requests (429 Terlalu Banyak Permintaan), hentikan pengiriman permintaan lebih lanjut untuk sementara waktu (lihat tajuk respon Retry-After)
  • Bila tersedia (seperti dengan Layanan Kueri Wikidata), tetapkan batas waktu terendah yang masuk akal untuk data Anda.
  • Saat menggunakan MediaWiki Action API, manfaatkan secara bebas parameter maxlag dan lihat panduan lainnya yang tercantum dalam API:Etiket.

Pencarian

Apa itu?

Wikidata menawarkan indeks Elasticsearch untuk pencarian tradisional melalui datanya: Special:Search

Kapan menggunakannya?

Gunakan pencarian saat Anda perlu mencari string teks, atau saat Anda mengetahui nama entitas yang Anda cari tetapi bukan entitas persisnya. Ini juga cocok untuk kasus di mana Anda dapat menentukan pencarian berdasarkan beberapa relasi yang sangat sederhana dalam data.

Jangan gunakan penelusuran saat relasi dalam data Anda lebih baik digambarkan sebagai kompleks.

Rincian

Anda dapat membuat pencarian Anda lebih kuat dengan kata kunci tambahan khusus untuk Wikidata: haswbstatement, inlabel, wbstatementquantity, hasdescription, haslabel. Fungsi pencarian ini didokumentasikan di halaman ekstensi CirrusSearch. Ia juga memiliki tindakan API sendiri.

Antarmuka Data Tertaut (URI)

Apa itu?

Antarmuka Data Tertaut menyediakan akses ke entitas individu melalui URI: http://www.wikidata.org/entity/Q???

Kapan menggunakannya?

Gunakan Antarmuka Data Tertaut saat Anda perlu mendapatkan entitas individual lengkap yang sudah Anda ketahui.

Jangan menggunakannya saat Anda tidak jelas tentang entitas mana yang Anda perlukan -- coba telusuri atau ajukan kueri terlebih dahulu. Itu juga tidak cocok untuk meminta data dalam jumlah besar.

Rincian

 
Butir Q42

Setiap Item atau Properti memiliki URI persisten yang dibuat dari ruang nama konsep Wikidata dan ID Item atau Properti (mis., Q42, P31) serta data konkret yang dapat diakses oleh Item atau Properti itu atau data Properti URL.

Ruang nama untuk data Wikidata tentang entitas adalah https://wikidata.org/wiki/Special:EntityData.

Menambahkan ID entitas ke awalan ini (singkatnya Anda dapat menggunakan /entity/) membuat bentuk abstrak (format-netral) dari URL data entitas. Saat mengakses sumber daya di ruang nama Special:EntityData, halaman khusus menerapkan negosiasi konten untuk menentukan format keluaran. Jika Anda membuka sumber daya di browser, Anda akan melihat halaman HTML yang berisi data tentang entitas, karena browser web lebih menyukai HTML. Namun, klien data tertaut akan menerima data entitas dalam format seperti JSON atau RDF -- apa pun yang ditentukan klien dalam header HTTP Accept: miliknya.

Sebagai contoh, ambil konsep URI ini untuk Douglas Adams -- yang mengacu pada orang di dunia nyata, bukan pada deskripsi konkret Wikidata:
http://www.wikidata.org/entity/Q42
Sebagai manusia dengan mata dan peramban, Anda mungkin ingin mengakses data tentang Douglas Adams dengan menggunakan konsep URI sebagai URL. Melakukan hal itu akan memicu pengalihan HTTP dan meneruskan klien ke URL data yang berisi data Wikidata tentang Douglas Adams: https://www.wikidata.org/wiki/Special:EntityData/Q42.

Saat Anda perlu melewati negosiasi konten, misalnya, untuk melihat konten non-HTML di browser web, Anda bisa menentukan format data entitas dengan menambahkan ekstensi yang sesuai ke URL data; contohnya termasuk .json, .rdf, .ttl, .nt atau .jsonld. Misalnya, https://www.wikidata.org/wiki/Special:EntityData/Q42.json memberi Anda Item Q42 dalam format JSON.

Output RDF yang kurang bertele-tele

Secara default, data RDF yang dikembalikan oleh antarmuka Data Tertaut dimaksudkan untuk menjadi lengkap dengan sendirinya, sehingga menyertakan deskripsi entitas lain yang dirujuknya. Jika Anda ingin mengecualikan informasi tersebut, Anda dapat menambahkan parameter kueri ?flavor=dump ke URL yang Anda minta.

Dengan menambahkan &flavor ke URL, Anda dapat mengontrol dengan tepat jenis data yang dikembalikan.

  • ?flavor=dump: Tidak termasuk deskripsi entitas yang dirujuk dalam data.
  • ?flavor=simple: Hanya memberikan pernyataan yang benar (pernyataan dengan peringkat terbaik tanpa penentu atau referensi), beserta tautan situs dan informasi versi.
  • ?flavor=full (default): Argumen "penuh" mengembalikan semua data. (Anda tidak perlu menentukan ini karena ini adalah defaultnya.)

Jika Anda ingin wawasan yang lebih dalam tentang apa yang diperlukan setiap opsi, Anda dapat mengintip ke dalam kode sumber.

Revisi dan menyembunyikan

Anda dapat meminta revisi tertentu dari suatu entitas dengan revision parameter kueri: https://www.wikidata.org/wiki/Special:EntityData/Q42.json?revision=112.

Format URL berikut masing-masing digunakan oleh antarmuka pengguna dan oleh pembaru layanan kueri, jadi jika Anda menggunakan salah satu format URL yang sama, kemungkinan besar Anda akan mendapatkan respons (cache) yang lebih cepat:

Layanan Kueri Wikidata

Apa itu?

Wikidata Query Service (WDQS) adalah titik akhir SPARQL milik Wikidata. Ia mengembalikan hasil kueri yang dibuat dalam bahasa kueri SPARQL: https://query.wikidata.org

Kapan menggunakannya?

Gunakan WDQS saat Anda hanya mengetahui karakteristik data yang diinginkan.

Jangan gunakan WDQS untuk melakukan pencarian teks atau fuzzy -- FILTER(REGEX(...)) adalah antipola. (Gunakan penelusuran dalam kasus tersebut.)

WDQS juga tidak cocok bila data yang Anda inginkan kemungkinan besar, persentase yang besar dari semua data Wikidata. (Pertimbangkan untuk menggunakan timbunan dalam kasus seperti itu.)

Rincian

Anda dapat mengkueri data di Wikidata melalui titik akhir SPARQL kami, Layanan Kueri Wikidata. Layanan ini dapat digunakan sebagai antarmuka web interaktif, atau secara terprogram dengan mengirimkan permintaan GET atau POST ke https://query.wikidata.org/sparql.

Layanan kueri paling baik digunakan saat rangkaian hasil yang Anda inginkan dicakup secara sempit, yaitu, saat Anda memiliki kueri, Anda cukup yakin sudah menentukan kumpulan data yang dihasilkan secara akurat. Jika ide Anda tentang kumpulan hasil kurang terdefinisi dengan baik, maka jenis pekerjaan yang akan Anda lakukan terhadap layanan kueri akan lebih menyerupai pencarian; sering kali Anda pertama-tama harus melakukan pekerjaan terkait penelusuran semacam ini untuk mempertajam kueri Anda. Lihat bagian Pencarian.

Titik akhir Fragmen Data Tertaut (Linked Data Fragments endpoint)

Apa itu?

Titik akhir Fragmen Data Tertaut (Linked Data Fragments endpoint (LDF)) adalah metode yang lebih eksperimental untuk mengakses data Wikidata dengan menentukan pola dalam tiga kali lipat: https://query.wikidata.org/bigdata/ldf. Komputasi terjadi terutama di sisi klien.

Kapan menggunakannya?

Gunakan titik akhir LDF saat Anda dapat menentukan data yang Anda cari menggunakan pola rangkap tiga, dan saat kumpulan hasil Anda cenderung cukup besar. Titik akhir bagus untuk digunakan saat Anda memiliki daya komputasi yang signifikan.

Karena ini eksperimental, jangan gunakan titik akhir LDF jika Anda memerlukan titik akhir yang benar-benar stabil atau rangkaian hasil yang lengkap. Dan seperti yang disebutkan sebelumnya, gunakan hanya jika Anda memiliki daya komputasi yang memadai, karena titik akhir LDF memindahkan komputasi ke sisi klien.

Rincian

Jika Anda memiliki sebagian informasi tentang apa yang Anda cari, seperti ketika Anda memiliki dua dari tiga komponen triple(s), Anda dapat menemukan apa yang Anda cari dengan menggunakan antarmuka Linked Data Fragments di https://query.wikidata.org/bigdata/ldf. Lihat panduan pengguna dan halaman komunitas untuk informasi lebih lanjut.

Wikibase REST API

What is it?

The Wikibase REST API is an OpenAPI-based interface that allows users to interact with, retrieve and edit items and statements on Wikibase instances – including of course Wikidata: Wikidata REST API

When to use it?

The Wikibase REST API is still under development, but for Wikidata it's intended to functionally replace the Action API as it's a dedicated interface made just for Wikibase/Wikidata.

The use cases for the Action API apply to the Wikibase REST API as well. Use it when your work involves:

  • Editing Wikidata
  • Getting direct data about entities themselves

Don't use the Wikibase REST API when your result set is likely to be large. (Consider using a dump in such cases.)

It's better not to use the Wikibase REST API when you'll need to further narrow the result of your API request. In such cases it's better to frame your work as a search (for Elasticsearch) or a query (for WDQS).

Details

The Wikibase REST API has OpenAPI documentation using Swagger. You can also review the developer documentation.https://doc.wikimedia.org/Wikibase/master/php/repo_rest-api_README.htmlhttps://doc.wikimedia.org/Wikibase/master/php/repo_rest-api_README.html

API Tindakan MediaWiki

Apa itu?

Wikidata API adalah Action API milik MediaWiki, diperluas untuk menyertakan beberapa tindakan khusus Wikibase: https://wikidata.org/w/api.php

Kapan menggunakannya?

Gunakan API saat pekerjaan Anda melibatkan:

  • Mengedit Wikidata
  • Mendapatkan data tentang entitas itu sendiri seperti riwayat revisinya
  • Mendapatkan semua data entitas dalam format JSON, dalam kelompok kecil entitas (hingga 50 entitas per permintaan).

Jangan gunakan API saat kumpulan hasil Anda cenderung besar. (Pertimbangkan untuk menggunakan tumpukan dalam kasus seperti itu.)

API juga kurang cocok untuk situasi di mana Anda ingin meminta status entitas saat ini di JSON. (Untuk kasus seperti itu, pertimbangkan untuk menggunakan Linked Data Interface, yang kemungkinan akan memberikan respons lebih cepat.)

Terakhir, mungkin merupakan ide yang buruk untuk menggunakan API saat Anda harus lebih mempersempit hasil permintaan API Anda. Dalam kasus seperti itu, lebih baik membingkai pekerjaan Anda sebagai penelusuran (untuk Elasticsearch) atau kueri (untuk WDQS).

Rincian

MediaWiki Action API yang digunakan untuk Wikidata didokumentasikan dengan cermat di halaman API Wikidata. Anda dapat menjelajahi dan bereksperimen dengannya menggunakan API Sandbox.

Bot

 
Kami mempersilahkan kehadiran bot yang baik

Anda juga dapat mengakses API dengan menggunakan bot. Untuk informasi lebih lanjut tentang bot, lihat Wikidata:Bots.

Aliran Perubahan Terbaru

Apa itu?

Aliran Perubahan Terbaru menyediakan aliran perubahan berkelanjutan dari semua wiki Wikimedia, termasuk Wikidata: https://stream.wikimedia.org

Kapan menggunakannya?

Gunakan Aliran Perubahan Terbaru saat proyek Anda mengharuskan Anda bereaksi terhadap perubahan secara waktu nyata atau saat Anda memerlukan semua perubahan terbaru yang berasal dari Wikidata -- misalnya, saat menjalankan layanan kueri Anda sendiri.

Rincian

Aliran Perubahan Terbaru berisi semua pembaruan dari semua wiki menggunakan protokol acara yang dikirim server. Anda perlu memfilter pemutakhiran Wikidata di sisi klien.

Anda dapat menemukan antarmuka web di stream.wikimedia.org dan membaca semuanya di halaman EventStreams.

Timbunan

Apakah mereka?

Timbunan Wikidata adalah ekspor lengkap dari semua Entitas di Wikidata: https://dumps.wikimedia.org

Kapan menggunakan mereka?

Gunakan tumpukan saat kumpulan hasil Anda cenderung sangat besar. Anda juga akan menemukan tumpukan penting saat menyiapkan layanan kueri Anda sendiri.

Jangan gunakan tumpukan jika Anda memerlukan data saat ini: tumpukan memerlukan waktu yang sangat lama untuk mengekspor dan bahkan lebih lama lagi untuk menyinkronkan ke layanan kueri Anda sendiri. Tumpukan juga tidak cocok jika Anda memiliki batasan yang signifikan pada bandwidth, ruang penyimpanan, dan/atau daya komputasi yang tersedia.

Rincian

Jika catatan yang perlu Anda lintasi banyak, atau jika kumpulan hasil Anda cenderung sangat besar, saatnya untuk mempertimbangkan bekerja dengan dump database: (tautan ke tumpukan lengkap terbaru).

Anda akan menemukan dokumentasi terperinci tentang semua dump Wikimedia pada halaman "Data tumpukan" di Meta dan tentang dump Wikidata khususnya di halaman pengunduhan basis data. Lihat juga Flavoured_dumps di atas.

Peralatan

  • JsonDumpReader adalah pustaka PHP untuk membaca timbunan.
  • Dengan [1] Anda akan menemukan pustaka Go untuk memproses tumpukan Wikipedia dan Wikidata.
  • Anda dapat menggunakan wdumper untuk mendapatkan tumpukan RDF khusus sebagian.

Layanan kueri lokal

Bukan tugas kecil untuk mendapatkan tumpukan Wikidata dan mengimplementasikan alat di atas untuk bekerja dengannya, tetapi Anda dapat mengambil langkah lebih jauh. Jika Anda memiliki kapasitas dan sumber daya untuk melakukannya, Anda dapat menghosting instansi Layanan Kueri Wikidata Anda sendiri dan menanyakannya sebanyak yang Anda suka, agar tidak berselisih dengan yang lain.

Untuk menyiapkan layanan kueri Anda sendiri, ikuti petunjuk ini dari tim layanan kueri, yang mencakup pengadaan salinan data lokal Anda sendiri. Anda juga dapat menemukan informasi berguna di blog post Adam Shorland tentang topik tersebut.