Wikidata:Download del database
Il contenuto di Wikidata è disponibilie per il download a chiunque.
Da notare che ci sono anche molti altri metodi per accedere al contenuto strutturato di Wikidata senza dover scaricare completamente un dump del database.
Dump del database
Sono disponibili diversi tipi di dump dei dati. Da notare che mentre i dump JSON e RDF sono considerati "interfacce stabili, i dump XML no. Le modifiche a al formato dei dati usati dalle interfacce stabili sono soggette alla Stable Interface Policy.
JSON dumps (recommended)
I dump in JSON contenenti tutte le entità di Wikidata in un singolo array JSON si possono trovare al link https://dumps.wikimedia.org/wikidatawiki/entities/. Le entità nell'array non sono necessariamente in un ordine particolare, ad es. Q2 non segue necessariamente Q1. I dump vengono creati su base settimanale.
Questo è il formato consigliato per i dump. Riferirsi alla documentazione della struttura JSON per informazioni su come sono rappresentate le entità di Wikidata.
Suggerimento: nel file JSON ogni oggetto entità (item o proprietà) è su una riga separata, così il file può essere letto riga per riga e ogni riga può essere codificata separatamente come un singolo oggetto JSON.
Tieni presente che le archiviazioni utilizzano compressione parallela, e ciò significa che alcuni scompattatori non possono decomprimere le archiviazioni in maniera affidabile. Se stai usando Windows puoi usare p.e. Bzip2.
You can currently download a fairly recent dump using a torrent. wikidata-20240101-all.json.gz (130.53 GiB) on academictorrents.com ( magnet)
JsonDumpReader è una libreria PHP per la lettura dei dump.
Dump RDF
First, canonical RDF dumps using the Turtle and NTriples formats can be found under https://dumps.wikimedia.org/wikidatawiki/entities/. The mapping is described here. These full statement dumps are noted as all.
Secondly, so called truthy dumps are provided. They use the NTriples format. They are in the same format as the full dumps, but only contain direct ("truthy", wdt:
and wdtn:
) values of best-rank statements. This also means they do not contain meta data such as qualifiers and references.
The -all dump files contain all entity information in Wikidata with the exception of order (of aliases, of statements, etc.), which is not naturally represented in RDF. The -truthy dump files encode the *best* statements (i.e. the ones with the highest non-deprecated rank of each given (subject, property) pair) as single RDF triples (qualifiers and references are omitted).
The dumps of Wikidata Lexeme namespace in Turtle and NTriples formats can be found in the same place with lexemes suffix.
For details on the RDF dump format please see the page RDF Dump Format. Also note the section "WDQS data differences" which explains the differences in the RDF formats of these dumps and the WDQS.
Partial RDF dumps
WDumper is a third-party tool to create custom Wikidata RDF dumps. Entities and statements may be filtered.
Dump XML
I dump completi in XML di Wikidata si possono trovare al link https://dumps.wikimedia.org/wikidatawiki/.
Avvertimento: il formato JSON incorporato nei dump XML è soggetto a modifiche senza preavviso e potrebbe essere incoerente tra le revisioni. Dovrebbe essere trattato come dati binari opachi. Si consiglia vivamente di utilizzare i dump JSON o RDF che utilizzano le rappresentazioni canoniche dei dati!
I dump incrementali (o "Add/Change dump") per Wikidata sono disponibili per il download. Questi dump contengono i dati aggiunti nelle ultime 24 ore, riducendo così la necessità di dover scaricare la copia completa del database. Queste copie parziali sono notevolmente meno pesanti rispetto a quelle complete.
Questi dump sono disponibili qui.
Old JSON and RDF dumps
Old RDF and JSON dumps can be found on the Internet Archive (Q461):
Data model
The data model can be looked up here. The data model describes the fundamental building blocks of Wikidata's data.
Database schema
An overview over the schema of the database can be found at this page. (This is not the schema of the data in Wikidata.)
License
Wikidata offre la possibilità di ottenere una copia dei contenuti disponibile per il download. Questi database potranno essere utilizzati per uso personale o commerciale, come backup o per usarli offline. Tutti i dati strutturati del namespace principale e le proprietà sono disponibili secondo la licenza Creative Commons CC0. Il testo degli altri namespace è disponibile secondo la licenza Creative Commons Attribuzione-Condividi allo stesso modo; possono applicarsi condizioni ulteriori. Gli oggetti multimediali e altri contenuti sono disponibili sotto altre licenze, come indicato nelle loro pagine di descrizione.
See also
- Wikipedia:Big data
- For instructions on retrieving RDF for individual items see the Data access page.
- Wikibase REST API