Wikidata:リンクト・オープン・データ(LOD)化のワークフロー
ウィキメディアのプロジェクトにデータ、メディア、その他の資産を投稿する際にはよく考えなければならないことがいろいろあります。以下の図はそのうちいくつかをリストアップして、リンクト・データのワークフローにおけるツールやスクリプトをいくつか追跡しようとする試みです。これはアウトリーチ・ウィキ上のデータ及びメディアのパートナーシップ図に基づいています。
PREPARE and normalize source data and media | RECONCILE with Wikimedia modeling and coverage | INGEST data, media, and free content | ANALYZE, correct, and enrich | RE-USE content intra-wiki and externally | REPORT and measure impact | |||||
---|---|---|---|---|---|---|---|---|---|---|
|
|
|
||||||||
| ||||||||||
NotesTry finding a similar project or collection set on Wikidata or Commons to see how it has been done in the past.
質問はウィキデータのメインプロジェクト・チャットやコモンズの井戸端で尋ねてください。
ウィキデータはCC0ライセンスを使用しています: 投稿データは全てCC0またはパブリックドメインとして献呈されなければなりません。 |
|
メモウィキデータに対して通常は、アップロードするデータセット(CSVファイルやAPIによるレコード)とウィキデータの用語をマッピングする"crosswalk database"が必要です。これはOpenRefineやGoogle Spreadsheetsを使ったカスタムマッピングなどで行なえます。 For Wikidata, usually a "crosswalk database" is needed to map terms from the uploading data set (a CSV file or records from an API) to Wikidata terms. This can be achieved with OpenRefine, a custom mapping using Google Spreadsheets, or both.
新しい項目に適切な"分類" (P31) 及び"上位クラス" (P279) プロパティをセットするために、その項目がウィキデータでどのようにモデル化されているかを調べます。 ケーススタディをここに追加してください。 |
|
メモ大量データセットの前に、少量のテストバッチでアップロードを試します。 Try uploading small test batches before doing large data sets. ウィキデータやコモンズにコレクションのメタデータやメディアファイルを取り込む際には、それらが相互に関連付けられているかどうか確認する方法が必要です。オブジェクトに対しては 所蔵番号(P217)にコレクション(P195)の修飾子と組織をつけたものがよく使われます。コモンズでのファイル名のベストプラクティスは組織/情報源、所蔵番号及び可能なら説明的なタイトルなどが組み合わされたものです。
ケーススタディをここに追加してください。 |
|
メモインポート及びアップロード手順がうまく行ったかどうかにより、他の編集者との重複や競合に対応する必要があるかもしれません。 Depending on the success of the import and uploading process, you may need to deal with duplicates or conflicts with other editors.
|
|
メモスクリプトやテンプレートでウィキデータから表や情報ボックスといったウィキ上のコンテンツを生成できます。 Scripts and templates can generate on-wiki content such as tables and infoboxes from Wikidata.
|
|
メモ使用されたファイルに関する測定基準やアクセス数の追跡によって投稿のインパクトを表示します。パートナーシップ用に、これは行われた作業を検証したりより多くの協力を奨励する手助けとなります。 Show the impact of contributions by tracking metrics on files used or impressions over time. For partnerships, this can help validate the work being done or to encourage more collaboration.
オンでマンド(GLAMorgan)のツールやGLAM組織のコモンズ・カテゴリにより定期的にレポートするものがあります。
|
| ||||||||||
ツールとスクリプト
PDFファイルを構造化データに変換します。あなたの情報源があまりよく整形されていない場合は、Tabula のようなスクレイピング・ツールを試してみてください。 |
ツールとスクリプト |
Tools and scriptsSandra FauconnierによるGLAM WIKI 2018カンファレンスでのOpenRefine ビデオ・チュートリアル |
ツールとスクリプト |
Tools and scripts
|
|
ツールとスクリプト
Wikidata:WikiProject sum of all paintings/Property statistics - User:Multichill Githubにあるスクリプト InteGraality - User:Jean-Frédéric ウィキデータの特定の部分に対するプロパティの網羅率のカスタム・ダッシュボードを生成するスクリプト。 Metropolitan Museum of Art向けのプロパティのダッシュボード Wikimedia Commons Data Roundtripping プロジェクトとレポート |
ツールとスクリプトInfoboxのチュートリアル: Wikidata:Infobox_Tutorial - ウィキデータと連携したウィキメディア及ぼその他プロジェクト向けの、ウィキデータを元にした情報ボックスやその他テンプレートの作成方法 コモンズのカテゴリ上のウィキデータ駆動の情報ボックス: Template:Wikidata Infobox - 作者者 User:Mike Peel |
ツールとスクリプトメトロポリタン美術館のウィキデータへのオープンアクセス貢献に関する統計を表示するウィキデータのクエリー: PAWS notebook by User:Fuzheado |
|}
ケーススタディ
- あなたのケースをここに追加してください
リンク
- Data and media partnerships workflow - データ及びメディアのパートナーシップに対する全般的な考察、ウィキデータ及びウィキメディア・コモンズ用の一連のツールも含む。
- Add yours here
Links
- Data and media partnerships workflow - General considerations for data and media partnerships, including a series of tools for Wikidata and Wikimedia Commons.
- Content Partnerships Hub/Software/Tool prioritization survey end 2022