Wikidata:リンクト・オープン・データ(LOD)化のワークフロー

This page is a translated version of the page Wikidata:Linked open data workflow and the translation is 39% complete.
Outdated translations are marked like this.

ウィキメディアのプロジェクトにデータ、メディア、その他の資産を投稿する際にはよく考えなければならないことがいろいろあります。以下の図はそのうちいくつかをリストアップして、リンクト・データのワークフローにおけるツールやスクリプトをいくつか追跡しようとする試みです。これはアウトリーチ・ウィキ上のデータ及びメディアのパートナーシップ図に基づいています。

PREPARE and normalize source data and media RECONCILE with Wikimedia modeling and coverage INGEST data, media, and free content ANALYZE, correct, and enrich RE-USE content intra-wiki and externally REPORT and measure impact
Notes

Try finding a similar project or collection set on Wikidata or Commons to see how it has been done in the past.


質問はウィキデータのメインプロジェクト・チャットやコモンズの井戸端で尋ねてください。


寄付しようとしているコンテンツがフリーなライセンスでリリースされているかまたは著作権が期限切れであることを確認してください。コモンズ向けに画像を準備する簡単な方法はFlickrにコレクションをアップロードして画像に適切なライセンス (CC0, CC-BY, CC-BY-SA)を設定することです。非商用(NC)ライセンスは使用しないでください。

ウィキデータはCC0ライセンスを使用しています: 投稿データは全てCC0またはパブリックドメインとして献呈されなければなりません。

メモ

ウィキデータに対して通常は、アップロードするデータセット(CSVファイルやAPIによるレコード)とウィキデータの用語をマッピングする"crosswalk database"が必要です。これはOpenRefineやGoogle Spreadsheetsを使ったカスタムマッピングなどで行なえます。

For Wikidata, usually a "crosswalk database" is needed to map terms from the uploading data set (a CSV file or records from an API) to Wikidata terms. This can be achieved with OpenRefine, a custom mapping using Google Spreadsheets, or both.


ウィキデータにはどのようなエンティティやプロパティが存在していて、コモンズではどのようなカテゴリやテンプレートが使われているかをチェックします。

新しい項目に適切な"分類" (P31) 及び"上位クラス" (P279) プロパティをセットするために、その項目がウィキデータでどのようにモデル化されているかを調べます。

ケーススタディをここに追加してください。

メモ

大量データセットの前に、少量のテストバッチでアップロードを試します。

Try uploading small test batches before doing large data sets.

ウィキデータやコモンズにコレクションのメタデータやメディアファイルを取り込む際には、それらが相互に関連付けられているかどうか確認する方法が必要です。オブジェクトに対しては 所蔵番号(P217)にコレクション(P195)の修飾子と組織をつけたものがよく使われます。コモンズでのファイル名のベストプラクティスは組織/情報源、所蔵番号及び可能なら説明的なタイトルなどが組み合わされたものです。


ウィキデータ項目の説明にP217を付けると、よく似た項目名を区別するのに役立ちます(例. 無題、または 花のある静物)

ケーススタディをここに追加してください。

メモ

インポート及びアップロード手順がうまく行ったかどうかにより、他の編集者との重複や競合に対応する必要があるかもしれません。

Depending on the success of the import and uploading process, you may need to deal with duplicates or conflicts with other editors.


コモンズ向けには、あなたはファイルを移動したりカテゴリを追加したりしなければならないかもしれません。


あなたは投稿したコンテンツを逐次追跡したり、初期の投稿後にプロパティやメタデータを追加し続けたりするために、特別なカスタム・メンテナンス用のクエリーを作成したいかもしれません。

メモ

スクリプトやテンプレートでウィキデータから表や情報ボックスといったウィキ上のコンテンツを生成できます。

Scripts and templates can generate on-wiki content such as tables and infoboxes from Wikidata.



識別子/典拠管理レコードがインポートされると、ウィキデータはクロスウォーク・データベースとして、多数の様々なデータベースどうしのマッピングを探索できます。

メモ

使用されたファイルに関する測定基準やアクセス数の追跡によって投稿のインパクトを表示します。パートナーシップ用に、これは行われた作業を検証したりより多くの協力を奨励する手助けとなります。

Show the impact of contributions by tracking metrics on files used or impressions over time. For partnerships, this can help validate the work being done or to encourage more collaboration.


オンでマンド(GLAMorgan)のツールやGLAM組織のコモンズ・カテゴリにより定期的にレポートするものがあります。


あなたはウィキデータ・クエリーを使って網羅率や利用状況のカスタムレポートを作成したいかもしれません。

ツールとスクリプト


PDFファイルを構造化データに変換します。あなたの情報源があまりよく整形されていない場合は、Tabula のようなスクレイピング・ツールを試してみてください。

ツールとスクリプト
Tools and scripts

Sandra FauconnierによるGLAM WIKI 2018カンファレンスでのOpenRefine ビデオ・チュートリアル

ツールとスクリプト
Tools and scripts


Pattypan は各ファイル用に必要なメタデータを集めるためにスプレッドシートを使ってメディアを一括アップロードするのにいちばんよく使われています。芸術作品、写真、その他メディア用のテンプレートを見つけて、ファイルをオーガナイズするための適切なカテゴリを識別してください。


Quickstatements はスプレッドシートから生成されたCSVの命令でウィキデータの文を作成します。


Mediawiki API はより高度な作業を行う場合に Python (PyWikibot または PAWS)によるプログラミング環境を提供しています。

ツールとスクリプト


プロパティ完成度の追跡:

Wikidata:WikiProject sum of all paintings/Property statistics - User:Multichill Githubにあるスクリプト

InteGraality - User:Jean-Frédéric ウィキデータの特定の部分に対するプロパティの網羅率のカスタム・ダッシュボードを生成するスクリプト。

Metropolitan Museum of Art向けのプロパティのダッシュボード

Wikimedia Commons Data Roundtripping プロジェクトとレポート

ツールとスクリプト

Infoboxのチュートリアル:

Wikidata:Infobox_Tutorial - ウィキデータと連携したウィキメディア及ぼその他プロジェクト向けの、ウィキデータを元にした情報ボックスやその他テンプレートの作成方法

コモンズのカテゴリ上のウィキデータ駆動の情報ボックス:

Template:Wikidata Infobox - 作者者 User:Mike Peel

ツールとスクリプト

メトロポリタン美術館のウィキデータへのオープンアクセス貢献に関する統計を表示するウィキデータのクエリー:

PAWS notebook by User:Fuzheado

|}

ケーススタディ

  • あなたのケースをここに追加してください

リンク

  • Data and media partnerships workflow - データ及びメディアのパートナーシップに対する全般的な考察、ウィキデータ及びウィキメディア・コモンズ用の一連のツールも含む。
  • Add yours here

Links