維基數據:開放式鏈結資料工作流程

This page is a translated version of the page Wikidata:Linked open data workflow and the translation is 37% complete.
Outdated translations are marked like this.

在你貢獻資料、媒體或其他產物於維基媒體專案時,會有許多要考量的部分。此份表格旨在列出某些在貢獻開放式鏈結資料工作流程中會使用到的追蹤工具、腳本等。此份表格是基於Outreach Wiki資料與媒體夥伴組 中的圖表所建立。

PREPARE and normalize source data and media RECONCILE with Wikimedia modeling and coverage INGEST data, media, and free content ANALYZE, correct, and enrich RE-USE content intra-wiki and externally REPORT and measure impact
Notes

Try finding a similar project or collection set on Wikidata or Commons to see how it has been done in the past.


請在Wikidata的 Project chat 或是Commons的 Village Pump 上提出您的問題。


貢獻內容者須確保其內容是在自由授權條款下發布或是其著作權已經消滅。其中一個為 Commons 準備圖片的簡單方式便是先將您的蒐藏上傳至 Flickr 並將其授權條款設定為 (NC)。 (CC0, CC-BY, CC-BY-SA)。請不要使用非商用授權條款 (NC) 。

Wikidata 使用 CC0 授權條款:任何上傳的資料必須屬於 CC0 授權條款或是公有領域。

備註

Wikidata 通常需要"crosswalk database"來標記資料集中的內容 (CSV檔或是API的紀錄) 整合進入 Wikidata 資料庫之中。這可以通過使用 OpenRefine、Google Spreadsheets,或是兩者一起來執行。

For Wikidata, usually a "crosswalk database" is needed to map terms from the uploading data set (a CSV file or records from an API) to Wikidata terms. This can be achieved with OpenRefine, a custom mapping using Google Spreadsheets, or both.


請查看 Wikidata 上已有哪些實體和屬性,以及在 Commons 上有那些分類和模板。

請查看在 Wikidata 上項目是如何被建立,以確保正確的為新項目添加屬性 "性質" (P31) 以及 "上級分類" (P279)。

需要參考案例

備註

在正式大量上傳之前建議先進行幾次小型的測試。

Try uploading small test batches before doing large data sets.

當向 Wikidata 和 Commons 輸入 metadata 以及多媒體檔案時,我們需要方法來確保檔案之間的連結性。蒐藏編號 (P217)通藏與蒐藏 (P195)和機構標誌符通常會被同時使用。最好的檔案命名方式是將機構/來源、蒐藏編號整合一起,最好還可以有描述性的標題。


在 Wikidata 項目的描述中添加 P217 可以協助分辨相似名稱的項目 (如 未命名、或是 Still Life with Flowers)

需要參考案例

備註

根據實際上傳情況,您或許會需要處理重複上傳或是與其他編輯者內容衝突的情況。

Depending on the success of the import and uploading process, you may need to deal with duplicates or conflicts with other editors.


在 Commons 上您或許需要將檔案移到不同位置或是新增分類。


您或許會希望建立一個專門的維護資料庫來追蹤您所貢獻的內容,或是持續的新增屬性和 metadata 至您所貢獻的內容之中。

備註

可以生成維基內容的模板或是命令,如 Wikidata 上的 infoboxes。

Scripts and templates can generate on-wiki content such as tables and infoboxes from Wikidata.



一旦標誌符/權威控制紀錄上傳到了 Wikidata, Wikidata 便可以成為各個資料庫之間的中繼站。

備註

追蹤檔案的使用,展示您的貢獻。對夥伴們而言,這可以協助驗證工作的完成度以及促進未來合作。

Show the impact of contributions by tracking metrics on files used or impressions over time. For partnerships, this can help validate the work being done or to encourage more collaboration.


Some tools are on-demand (GLAMorgan) and some are regularly reported based on Commons categories of GLAM institutions.


您或許也會希望使用 Wikidata Query 來建立一些自訂報告來呈現使用率等資訊。

工具


Convert PDF files to structured data. If your source data is not well formatted, try a scraping tool like [<tvar name=1">https://tabula.technology/</tvar> Tabula]

Tools and scripts

OpenRefine video tutorial from GLAM WIKI 2018 conference with Sandra Fauconnier

Tools and scripts


Pattypan 是大量上傳媒體檔案最受歡迎的工具,它可以從表格中提取每個檔案所需的 metadata。為藝術品、照片、或是其他類型的媒體檔案尋找正確的模板來套用,並尋找適當的分類來整理檔案。


Quickstatements 從表格生成 CSV 資料以創建 Wikidata 陳述。


Mediawiki API 提供使用 Python (PyWikibot 或 PAWS) 編程環境來進行更進階的操作。

工具


追蹤屬性完整性:

InteGraality - User:Jean-Frédéric 可以客製化生成在特定區塊的 Wikidata 中的屬性使用率控制台。

Metropolitan Museum of Art 的屬性控制台。

工具

Infobox 教學:

Wikidata:Infobox_Tutorial - 如何製作由 Wikidata 資料所驅動的 infoboxes ,或是為 Wikipedia 以及其他與 Wikidata 連接的專案所使用的模板。

Wikidata 所驅動的 Commons 分類 infoboxes :

Template:Wikidata Infobox - 由 User:Mike Peel 所建立。

工具

展示 Met Museum 開放資料貢獻資訊的 Wikidata Queries:

PAWS notebook 由 User:Fuzheado

提供|}

案例研究

  • 在此新增

連結

  • Add yours here