維基數據:開放式鏈結資料工作流程
在你貢獻資料、媒體或其他產物於維基媒體專案時,會有許多要考量的部分。此份表格旨在列出某些在貢獻開放式鏈結資料工作流程中會使用到的追蹤工具、腳本等。此份表格是基於Outreach Wiki資料與媒體夥伴組 中的圖表所建立。
PREPARE and normalize source data and media | RECONCILE with Wikimedia modeling and coverage | INGEST data, media, and free content | ANALYZE, correct, and enrich | RE-USE content intra-wiki and externally | REPORT and measure impact | |||||
---|---|---|---|---|---|---|---|---|---|---|
|
|
|||||||||
| ||||||||||
NotesTry finding a similar project or collection set on Wikidata or Commons to see how it has been done in the past.
請在Wikidata的 Project chat 或是Commons的 Village Pump 上提出您的問題。
Wikidata 使用 CC0 授權條款:任何上傳的資料必須屬於 CC0 授權條款或是公有領域。 |
|
備註Wikidata 通常需要"crosswalk database"來標記資料集中的內容 (CSV檔或是API的紀錄) 整合進入 Wikidata 資料庫之中。這可以通過使用 OpenRefine、Google Spreadsheets,或是兩者一起來執行。 For Wikidata, usually a "crosswalk database" is needed to map terms from the uploading data set (a CSV file or records from an API) to Wikidata terms. This can be achieved with OpenRefine, a custom mapping using Google Spreadsheets, or both.
請查看在 Wikidata 上項目是如何被建立,以確保正確的為新項目添加屬性 "性質" (P31) 以及 "上級分類" (P279)。 需要參考案例 |
|
備註在正式大量上傳之前建議先進行幾次小型的測試。 Try uploading small test batches before doing large data sets. 當向 Wikidata 和 Commons 輸入 metadata 以及多媒體檔案時,我們需要方法來確保檔案之間的連結性。蒐藏編號 (P217)通藏與蒐藏 (P195)和機構標誌符通常會被同時使用。最好的檔案命名方式是將機構/來源、蒐藏編號整合一起,最好還可以有描述性的標題。
需要參考案例 |
|
備註根據實際上傳情況,您或許會需要處理重複上傳或是與其他編輯者內容衝突的情況。 Depending on the success of the import and uploading process, you may need to deal with duplicates or conflicts with other editors.
|
|
備註可以生成維基內容的模板或是命令,如 Wikidata 上的 infoboxes。 Scripts and templates can generate on-wiki content such as tables and infoboxes from Wikidata.
|
|
備註追蹤檔案的使用,展示您的貢獻。對夥伴們而言,這可以協助驗證工作的完成度以及促進未來合作。 Show the impact of contributions by tracking metrics on files used or impressions over time. For partnerships, this can help validate the work being done or to encourage more collaboration.
Some tools are on-demand (GLAMorgan) and some are regularly reported based on Commons categories of GLAM institutions.
|
| ||||||||||
工具
Convert PDF files to structured data. If your source data is not well formatted, try a scraping tool like [<tvar name=1">https://tabula.technology/</tvar> Tabula] |
Tools and scriptsOpenRefine video tutorial from GLAM WIKI 2018 conference with Sandra Fauconnier |
Tools and scripts
|
|
工具
InteGraality - User:Jean-Frédéric 可以客製化生成在特定區塊的 Wikidata 中的屬性使用率控制台。 Metropolitan Museum of Art 的屬性控制台。 |
工具Infobox 教學: Wikidata:Infobox_Tutorial - 如何製作由 Wikidata 資料所驅動的 infoboxes ,或是為 Wikipedia 以及其他與 Wikidata 連接的專案所使用的模板。 Wikidata 所驅動的 Commons 分類 infoboxes : Template:Wikidata Infobox - 由 User:Mike Peel 所建立。 |
工具展示 Met Museum 開放資料貢獻資訊的 Wikidata Queries: PAWS notebook 由 User:Fuzheado 提供|} |
案例研究
- 在此新增
連結
- Data and media partnerships workflow - 有關資料和媒體和夥伴關係的一般討論,包括 Wikidata 和 Wikimedia Commons 的相關工具。
- Add yours here
Links
- Data and media partnerships workflow - General considerations for data and media partnerships, including a series of tools for Wikidata and Wikimedia Commons.
- Content Partnerships Hub/Software/Tool prioritization survey end 2022
- GLAM CSI - 2024 project to analyze the toolset, workflows, and user stories of GLAM wiki community