Open main menu

Wikidata:Téléchargement de la base de données

This page is a translated version of the page Wikidata:Database download and the translation is 96% complete.

Other languages:
Bahasa Indonesia • ‎Bahasa Melayu • ‎Deutsch • ‎English • ‎Esperanto • ‎Frysk • ‎Lëtzebuergesch • ‎Nederlands • ‎Ripoarisch • ‎Türkçe • ‎català • ‎dansk • ‎dolnoserbski • ‎español • ‎français • ‎hornjoserbsce • ‎italiano • ‎latviešu • ‎norsk bokmål • ‎occitan • ‎polski • ‎português do Brasil • ‎suomi • ‎svenska • ‎čeština • ‎Ελληνικά • ‎беларуская • ‎македонски • ‎русский • ‎српски / srpski • ‎українська • ‎հայերեն • ‎עברית • ‎العربية • ‎فارسی • ‎پښتو • ‎বাংলা • ‎ગુજરાતી • ‎ไทย • ‎ქართული • ‎中文 • ‎日本語 • ‎한국어

Crystal Project Db update.png

Wikidata propose des copies du contenu disponible librement téléchargeable.

Veuillez noter qu'il existe aussi plusieurs autres méthodes pour accéder au contenu structuré de Wikidata, qui ne nécessitent pas un dump complet de la base de données.

Contents

Dumps de la base de données

Différents types de dumps sont disponibles. Veuillez noter que bien que les dumps au format JSON et RDF soit considérés comme des interfaces stables, ce n'est pas le cas des dumps au format XML. Les changements apportés aux formats de données utilisés par les interfaces stables sont sujet à la Police d'interface stable.

Dumps JSON (recommandé)

Les dumps JSON contenant tous les éléments Wikidata sous forme d'un seul tableau JSON peuvent être trouvés à https://dumps.wikimedia.org/wikidatawiki/entities/. Les entités dans le tableau peuvent être dans le désordre : par exemple, Q2 ne se trouve pas forcément après Q1. Ces dumps sont crées de façon hebdomadaire.

C’est le format de dump recommandé. Veuillez vous référer à la documentation de la structure JSON pour trouver des informations sur comment les entités Wikidata sont représentées.

Astuce: Chaque objet entité (élément ou propriété) est placé sur une ligne séparée du fichier JSON, pour que le fichier puisse être lu ligne à ligne, et chaque ligne peut être décodée séparément comme un objet JSON individuel.

À noter que les fichiers sont utilisées en compressions parallèles, ce qui signifie que certains décompresseurs ne peut pas décompresser de façon fiable les fichiers. Si vous utilisez Windows, vous pouvez utiliser Bzip2 par exemple.

JsonDumpReader est une bibliothèque PHP pour la lecture des dumps.

Archives en format RDF

Premièrement, les dumps RDF canoniques utilisant le format Turtle sont accessibles à partir du lien https://dumps.wikimedia.org/wikidatawiki/entities/. La cartographie est décrite ici. Ces faits complets sont indiqués avec "all".

Secondly, so called truthy dumps are provided. They use the nt format. They are in the same format as the full dumps, but limited to direct, truthy statements. Therefore, they do not contain meta data such as qualifier and references.

Les archives complètes contiennent toutes les informations sur les entités de Wikidata, à l'exception de l'ordre (des alias, des déclaration, etc.) qui ne se représente pas de manière évidente en RDF. L'archive simplifiée code les déclarations sans qualificatifs en un triplet RDF unique (les références n'y figurent pas).

Dumps XML

Les dumps sont téléchargeables à https://dumps.wikimedia.org/wikidatawiki/.

Attention : """ le format des données JSON contenues dans les dumps XML est susceptible de changer à tout moment, et peut être incohérent d'une version à l'autre. Il devrait être traité comme des données binaires opaques. Il est fortement recommandé d'utiliser les dumps JSON ou RDF à la place, qui utilisent des représentations canoniques des données !

Des dumps incrémentiels de Wikidata sont disponibles au téléchargement. Ces dumps contiennent ce qui a été ajouté durant les dernières 24 heures, limitant le besoin de télécharger la base de données complète. Ces dumps sont bien plus légers que ceux de la base complète.

Ces dumps peuvent être trouvés sur https://dumps.wikimedia.org/other/incr/wikidatawiki/.

Anciens dumps JSON et RDF

Les vieux dumps RDF et JSON sont disponibles sur le Internet Archive (Q461):

Modèle de données

Le modèle de données peut être consulté ici. Il décrit les blocs de construction fondamentaux des données de Wikidata.

Schéma de la base de données

Le site de Wikibase sur Wikimedia.org possède une vue d'ensemble de ce schéma (qui n'est pas le schéma du modèle de données Wikidata).

Licence

Ces bases de données peuvent être utilisées pour un usage personnel ou commercial, comme sauvegardes ou pour utilisation locale. Toutes les données structurées de l’espace de noms principal des propriétés est disponible sous licence Creative Commons CC0 (résumé en français). Les textes des autres espaces de noms sont disponibles sous licence Creative Commons Attribution Partage à l’identique (résumé en français); d’autres conditions peuvent s’appliquer. Les contenus de l’espace de noms Media sont disponibles sous d’autres licences, décrites sur leurs pages de description.