Wikidata: fluxo de trabalho com dados abertos ligados (LOD)

This page is a translated version of the page Wikidata:Linked open data workflow and the translation is 39% complete.
Outdated translations are marked like this.

São várias as considerações a ter em conta na contribuição de dados, arquivos ou outros recursos nos projectos Wikimedia. Este quadro tenta listar algumas delas, bem como ferramentas de rastreamento e scripts que fazem parte do fluxo de trabalho com dados ligados. Baseia-se em neste quadro da Outreach Wiki.

PREPARE and normalize source data and media RECONCILE with Wikimedia modeling and coverage INGEST data, media, and free content ANALYZE, correct, and enrich RE-USE content intra-wiki and externally REPORT and measure impact
Notes

Try finding a similar project or collection set on Wikidata or Commons to see how it has been done in the past.


Faz perguntas no chat do projeto em Wikidata ou no Village Pump do Commons.


Quem doa conteúdo deve assegurar-se de que os recursos são libertados sob uma licença livre ou de que os direitos de autor já expiraram. Uma maneira fácil de preparar imagens para Commons é carregar as colecções para o Flickr, definindo uma licença adequada para as imagens (CC0, CC-BY, CC-BY-SA). Não utilize licenças não comerciais (NC) ou que não permitam uma obra derivada (ND).

O Wikidata usa uma licença CC0: quaisquer dados inseridos devem estar sob CC0 ou no domínio público.

Notas

Para o Wikidata, normalmente é necessária uma base de dados de conciliação, de modo a mapear termos desse conjunto de dados (um ficheiro CSV ou registos de uma API) com os termos do Wikidata. Isto pode ser alcançado utilizando o OpenRefine, um sistema personalizado utilizando folhas de cálculo da Google, ou ambos.

For Wikidata, usually a "crosswalk database" is needed to map terms from the uploading data set (a CSV file or records from an API) to Wikidata terms. This can be achieved with OpenRefine, a custom mapping using Google Spreadsheets, or both.


Verifique quais as entidades e propriedades já existentes no Wikidata e quais as categorias e modelos utilizadas no Commons.

Averigue de que forma as entidades estão modeladas no Wikidata, de maneira a definir as propriedades adequadas de "instância de" (P31) e "subclase de" (P279) nos novos elementos.

Casos de estudo aqui.

Notas

Experimente carregar pequenos lotes antes de avançar para grandes bases de dados.

Try uploading small test batches before doing large data sets.

Ao acrescentar metadados de coleções e arquivos multimédia no Wikidata e Commons, é preciso assegurar uma forma de garantir que os dados estão correlacionados. O número de inventário (P217) utiliza-se com frequência para objetos, com um qualificador para uma colecção (P195) e a instituição. Incorporar a instituição/fonte, o número de inventário e um título descritivo no nome do ficheiro é uma boa prática para carregamentos no Commons.


Pôr P217 na descrição de um elemento de Wikidata pode ajudar a distinguir nomes de elementos que são muito similares (ex. Sem título, ou Natureza Morta com Flores)

Casos de estudo aqui.

Notas

Consoante o sucesso dos processos de importação e carregamento, é possível que tenha que lidar com duplicados ou conflitos com outros editores.

Depending on the success of the import and uploading process, you may need to deal with duplicates or conflicts with other editors.


Para Commons, talvez precise de mover ficheiros ou agregar categorias adicionais.


É possível criar consultas/pedidos de manutenção personalizados, de modo a acompanhar o conteúdo carregado ao longo do tempo, ou para continuar a acrescentar propriedades e metadados para lá da contribuição inicial.

Notas

Scripts e pré-definições podem gerar conteúdo wiki, como tabelas e infocaixas, com informação proveniente do Wikidata.

Scripts and templates can generate on-wiki content such as tables and infoboxes from Wikidata.


Se forem importados identificadores/registos de controlo de autoridade, o Wikidata pode servir como base de cruzamento dos dados.

Notas

Demonstre o impacto das contribuições mediante o rastreamento das métricas dos ficheiros utilizados ou das visualizações ao longo do tempo. No caso de instituições, isto pode ajudar a validar o trabalho que está ser realizado ou a fomentar uma maior colaboração.

Show the impact of contributions by tracking metrics on files used or impressions over time. For partnerships, this can help validate the work being done or to encourage more collaboration.


Algumas ferramentas funcionam sob pedido (GLAMorgan) e outras são reportadas regularmente com base em categorias de instituições GLAM de Commons.


Também é possível utilizar o serviço Wikidata Query para realizar alguns relatórios personalizados sobre a cobertura ou o uso dos dados.

Ferramentas e scripts


Converte ficheiros PDF em dados estruturados. Se os dados de origem não estiverem bem formatados, experimente uma ferramenta de extração de informação como a Tabula

Ferramentas e scripts
Tools and scripts

Tutorial de OpenRefine ministrado por Sandra Fauconnier durante a conferência GLAM WIKI 2018

Ferramentas e scripts
Tools and scripts


Pattypan é a forma mais popular de carregar ficheiros em lotes utilizando uma folha de cálculo para recompilar os metadados necessários a cada ficheiro. Encontre o modelo apropriado para obras de arte, fotos ou outros recursos e identifique as categorias adequadas para organizar os ficheiros.


Quickstatements transforma dados numa tabela CSV em declarações de Wikidata.


A API Mediawiki fornece um ambiente de programação em Python (PyWikibot ou PAWS) para realizar tarefas avançadas.

Ferramentas e scripts


Rastreamento de grau de completude de uma propriedade:

Wikidata:WikiProjeto soma de todas as pinturas/Estatísticas de propriedades (em inglês) - script no GitHub do utilizador Multichill

InteGraality - Script para gerar painéis personalizados sobre a cobertura de uma propriedade para uma parte determinada de Wikidata, do utilizador Jean-Frédéric.

Painel de propriedades do Metropolitan Museum of Art

Projeto e relatório da iniciativa Wikimedia Commons Data Roundtripping

Ferramentas e scripts

Tutoriais de infocaixas:

Wikidata:Infobox_Tutorial - como criar infocaixas e outras predefinições para Wikipédia e outros projectos ligadas a Wikidata usando o dados do Wikidata

Infocaixas baseadas em Wikidata nas categorias do Commons:

Predefinição:Wikidata Infobox - criada por Mike Peel

Ferramentas e scripts

Wikidata Queries para mostrar estatísticas sobre as contribuições do Met Museum para a Wikidata:

PAWS notebook de User:Fuzheado

|}

Casos de estudo

  • Acrescente aqui

Ligações

  • Add yours here

Links