Wikidata: fluxo de trabalho com dados abertos ligados (LOD)
São várias as considerações a ter em conta na contribuição de dados, arquivos ou outros recursos nos projectos Wikimedia. Este quadro tenta listar algumas delas, bem como ferramentas de rastreamento e scripts que fazem parte do fluxo de trabalho com dados ligados. Baseia-se em neste quadro da Outreach Wiki.
PREPARE and normalize source data and media | RECONCILE with Wikimedia modeling and coverage | INGEST data, media, and free content | ANALYZE, correct, and enrich | RE-USE content intra-wiki and externally | REPORT and measure impact | |||||
---|---|---|---|---|---|---|---|---|---|---|
|
|
|
||||||||
| ||||||||||
NotesTry finding a similar project or collection set on Wikidata or Commons to see how it has been done in the past.
Faz perguntas no chat do projeto em Wikidata ou no Village Pump do Commons.
O Wikidata usa uma licença CC0: quaisquer dados inseridos devem estar sob CC0 ou no domínio público. |
|
NotasPara o Wikidata, normalmente é necessária uma base de dados de conciliação, de modo a mapear termos desse conjunto de dados (um ficheiro CSV ou registos de uma API) com os termos do Wikidata. Isto pode ser alcançado utilizando o OpenRefine, um sistema personalizado utilizando folhas de cálculo da Google, ou ambos. For Wikidata, usually a "crosswalk database" is needed to map terms from the uploading data set (a CSV file or records from an API) to Wikidata terms. This can be achieved with OpenRefine, a custom mapping using Google Spreadsheets, or both.
Averigue de que forma as entidades estão modeladas no Wikidata, de maneira a definir as propriedades adequadas de "instância de" (P31) e "subclase de" (P279) nos novos elementos. Casos de estudo aqui. |
|
NotasExperimente carregar pequenos lotes antes de avançar para grandes bases de dados. Try uploading small test batches before doing large data sets. Ao acrescentar metadados de coleções e arquivos multimédia no Wikidata e Commons, é preciso assegurar uma forma de garantir que os dados estão correlacionados. O número de inventário (P217) utiliza-se com frequência para objetos, com um qualificador para uma colecção (P195) e a instituição. Incorporar a instituição/fonte, o número de inventário e um título descritivo no nome do ficheiro é uma boa prática para carregamentos no Commons.
Casos de estudo aqui. |
|
NotasConsoante o sucesso dos processos de importação e carregamento, é possível que tenha que lidar com duplicados ou conflitos com outros editores. Depending on the success of the import and uploading process, you may need to deal with duplicates or conflicts with other editors.
|
|
NotasScripts e pré-definições podem gerar conteúdo wiki, como tabelas e infocaixas, com informação proveniente do Wikidata. Scripts and templates can generate on-wiki content such as tables and infoboxes from Wikidata.
Se forem importados identificadores/registos de controlo de autoridade, o Wikidata pode servir como base de cruzamento dos dados. |
|
NotasDemonstre o impacto das contribuições mediante o rastreamento das métricas dos ficheiros utilizados ou das visualizações ao longo do tempo. No caso de instituições, isto pode ajudar a validar o trabalho que está ser realizado ou a fomentar uma maior colaboração. Show the impact of contributions by tracking metrics on files used or impressions over time. For partnerships, this can help validate the work being done or to encourage more collaboration.
Algumas ferramentas funcionam sob pedido (GLAMorgan) e outras são reportadas regularmente com base em categorias de instituições GLAM de Commons.
|
| ||||||||||
Ferramentas e scripts
Converte ficheiros PDF em dados estruturados. Se os dados de origem não estiverem bem formatados, experimente uma ferramenta de extração de informação como a Tabula |
Ferramentas e scripts |
Tools and scriptsTutorial de OpenRefine ministrado por Sandra Fauconnier durante a conferência GLAM WIKI 2018 |
Ferramentas e scripts |
Tools and scripts
|
|
Ferramentas e scripts
Wikidata:WikiProjeto soma de todas as pinturas/Estatísticas de propriedades (em inglês) - script no GitHub do utilizador Multichill InteGraality - Script para gerar painéis personalizados sobre a cobertura de uma propriedade para uma parte determinada de Wikidata, do utilizador Jean-Frédéric. Painel de propriedades do Metropolitan Museum of Art Projeto e relatório da iniciativa Wikimedia Commons Data Roundtripping |
Ferramentas e scriptsTutoriais de infocaixas: Wikidata:Infobox_Tutorial - como criar infocaixas e outras predefinições para Wikipédia e outros projectos ligadas a Wikidata usando o dados do Wikidata Infocaixas baseadas em Wikidata nas categorias do Commons: Predefinição:Wikidata Infobox - criada por Mike Peel |
Ferramentas e scriptsWikidata Queries para mostrar estatísticas sobre as contribuições do Met Museum para a Wikidata: PAWS notebook de User:Fuzheado |
|}
Casos de estudo
- Acrescente aqui
Ligações
- Fluxo de trabalho para parcerias GLAM de dados e multimédia (em inglês) - Considerações genéricas relativas a parcerias de carregamento de dados e multimédia por instituições GLAM, incluindo uma série de ferramentas para Wikidata e Wikimedia Commons.
- Add yours here
Links
- Data and media partnerships workflow - General considerations for data and media partnerships, including a series of tools for Wikidata and Wikimedia Commons.
- Content Partnerships Hub/Software/Tool prioritization survey end 2022