Wikidata:Descarga de base de datos

This page is a translated version of the page Wikidata:Database download and the translation is 86% complete.
Outdated translations are marked like this.

Wikidata ofrece copias del contenido disponible para que cualquiera lo descargue.

Tenga en cuenta que también hay varios otros métodos para acceder al contenido estructurado de Wikidata, que pueden no requerir un volcado de base de datos completo.

Volcados de bases de datos

Hay varios tipos diferentes de volcados de datos disponibles. Tenga en cuenta que mientras los volcados JSON y RDF se consideran interfaces estables, los volcados XML no lo son. Los cambios en los formatos de datos utilizados por las interfaces estables están sujetos a la Política de interfaz estable.

<span id="JSON_dumps_(recommended)_">

Volcados JSON (recomendado)

Los volcados JSON que contienen todas las entidades Wikidata en una única matriz JSON se pueden encontrar en https://dumps.wikimedia.org/wikidatawiki/entities/. Las entidades en la matriz no están necesariamente en ningún orden particular, por ejemplo, Q2 no necesariamente sigue a Q1. Los volcados se crean semanalmente.

Este es el formato de volcado recomendado. Por favor, consulte la documentación de la estructura JSON para obtener información sobre cómo se representan las entidades Wikidata.

Sugerencia: cada objeto de entidad (elemento de datos o propiedad) se coloca en una línea separada en el archivo JSON, por lo que el archivo se puede leer línea por línea, y cada línea se puede decodificar separadamente como un objeto JSON individual.

Tenga en cuenta que los archivos utilizan compresión paralela, lo que significa que algunos descompresores no pueden descomprimir los archivos de manera confiable. Si está usando Windows puede usar p.e. Bzip2.

You can currently download a fairly recent dump using a torrent. wikidata-20220103-all.json.gz (109.04 GiB) on academictorrents.com (  magnet)

JsonDumpReader es una biblioteca de PHP para leer los volcados.

Volcados RDF

En primer lugar, los volcados RDF canónicos usan los formatos Turtle y NTriples que se puede encontrar en https://dumps.wikimedia.org/wikidatawiki/entities/. El mapeo se describe aquí. Estas declaraciones completas se mencionan como todo.

En segundo lugar, se proporcionan los llamados volcados truthy. Estos usan el formato nt. Están en el mismo formato que los volcados completos, pero limitado a declaraciones directas y verídicas. Por lo tanto, no contienen metadatos como calificadores y referencias.

Los volcados completos juntos contienen toda la información de la entidad en Wikidata con la excepción del orden (de alias, de declaraciones, etc.), que no se representa de forma natural en RDF. Los volcados simplificados codifican declaraciones que no tienen calificadores como triples RDF individuales (las referencias se omiten).

Los volcados del espacio de nombres Wikidata Lexeme en los formatos Turtle y NTriples se pueden encontrar en el mismo lugar con el sufijo lexemes.

For details on the RDF dump format please see the page RDF Dump Format.

Volcados parciales de RDF

WDumper es una herramienta de terceros para crear volcados de wikidata RDF personalizados. Las entidades y declaraciones pueden ser filtradas.

Volcados XML

Los volcados XML completos de Wikidata están disponibles en https://dumps.wikimedia.org/wikidatawiki/.

Advertencia: El formato de los datos JSON integrado en los volcados XML está sujeto a cambios sin previo aviso, y puede ser inconsistente entre las revisiones. Deben tratarse como datos binarios opacos. ¡Se recomienda encarecidamente utilizar los volcados JSON o RDF, que utilizan representaciones canónicas de los datos!

Los volcados incrementales para Wikidata también están disponibles para su descarga. Estos volcados contienen material que se agregó en las últimas 24 horas, lo que reduce la necesidad de tener que descargar el volcado completo de la base de datos. Estos volcados son considerablemente más pequeños que los volcados de bases de datos completos.

Se pueden encontrar en https://dumps.wikimedia.org/other/incr/wikidatawiki/.

Volcados JSON y RDF antiguos

Los volcados RDF y JSON antiguos se pueden encontrar en Internet Archive (Q461):

Modelo de datos

El modelo de datos se puede ver aquí. El modelo de datos describe los pilares fundamentales de los datos de Wikidata.

Esquema de la base de datos

Se puede encontrar una descripción general sobre el esquema de la base de datos en esta página. (Este no es el esquema de los datos en Wikidata).

Licencia

Estas bases de datos pueden ser utilizadas para uso personal o comercial, copias de seguridad o uso fuera de línea. Todo dato estructurado de los espacios de nombres principal y Property (propiedad), Lexeme (lexema) y EntitySchema (esquema de entidad), está disponible bajo la Licencia Creative Commons CC0. El texto en otros espacios de nombres está disponible bajo la Licencia Creative Commons Reconocimiento/CompartirIgual; términos adicionales pueden ser aplicados. Los elementos multimedia y otro contenido están disponibles bajo otras licencias, como se detalla en sus páginas de descripción.

Véase también