Wikidata:リンクト・オープン・データ(LOD)化のワークフロー

This page is a translated version of the page Wikidata:Linked open data workflow and the translation is 98% complete.
Outdated translations are marked like this.
Other languages:

ウィキメディアのプロジェクトにデータ、メディア、その他の資産を投稿する際にはよく考えなければならないことがいろいろあります。以下の図はそのうちいくつかをリストアップして、リンクト・データのワークフローにおけるツールやスクリプトをいくつか追跡しようとする試みです。これはアウトリーチ・ウィキ上のデータ及びメディアのパートナーシップ図に基づいています。

元データ及び画像の準備と整理 ウィキメディアでのモデリングと網羅率との照合 データ及びメディアを取り込む 分析、修正及び拡張 ウィキ内及び外部でのコンテンツ再利用 報告と計測
メモ

ウィキデータやコモンズ上の類似プロジェクトやコレクションを探して、過去にどのように行われてきたかを調べてみてください。


質問はウィキデータのメインプロジェクト・チャットやコモンズの井戸端で尋ねてください。


寄付しようとしているコンテンツがフリーなライセンスでリリースされているかまたは著作権が期限切れであることを確認してください。コモンズ向けに画像を準備する簡単な方法はFlickrにコレクションをアップロードして画像に適切なライセンス (CC0, CC-BY, CC-BY-SA)を設定することです。非商用(NC)ライセンスは使用しないでください。

ウィキデータはCC0ライセンスを使用しています: 投稿データは全てCC0またはパブリックドメインとして献呈されなければなりません。

メモ

ウィキデータに対して通常は、アップロードするデータセット(CSVファイルやAPIによるレコード)とウィキデータの用語をマッピングする"crosswalk database"が必要です。これはOpenRefineやGoogle Spreadsheetsを使ったカスタムマッピングなどで行なえます。


ウィキデータにはどのようなエンティティやプロパティが存在していて、コモンズではどのようなカテゴリやテンプレートが使われているかをチェックします。

新しい項目に適切な"分類" (P31) 及び"上位クラス" (P279) プロパティをセットするために、その項目がウィキデータでどのようにモデル化されているかを調べます。

ケーススタディをここに追加してください。

メモ

大量データセットの前に、少量のテストバッチでアップロードを試します。

ウィキデータやコモンズにコレクションのメタデータやメディアファイルを取り込む際には、それらが相互に関連付けられているかどうか確認する方法が必要です。オブジェクトに対しては 所蔵番号(P217)にコレクション(P195)の修飾子と組織をつけたものがよく使われます。コモンズでのファイル名のベストプラクティスは組織/情報源、所蔵番号及び可能なら説明的なタイトルなどが組み合わされたものです。


ウィキデータ項目の説明にP217を付けると、よく似た項目名を区別するのに役立ちます(例. 無題、または 花のある静物)

ケーススタディをここに追加してください。

メモ

インポート及びアップロード手順がうまく行ったかどうかにより、他の編集者との重複や競合に対応する必要があるかもしれません。


コモンズ向けには、あなたはファイルを移動したりカテゴリを追加したりしなければならないかもしれません。


あなたは投稿したコンテンツを逐次追跡したり、初期の投稿後にプロパティやメタデータを追加し続けたりするために、特別なカスタム・メンテナンス用のクエリーを作成したいかもしれません。

メモ

スクリプトやテンプレートでウィキデータから表や情報ボックスといったウィキ上のコンテンツを生成できます。


識別子/典拠管理レコードがインポートされると、ウィキデータはクロスウォーク・データベースとして、多数の様々なデータベースどうしのマッピングを探索できます。

メモ

使用されたファイルに関する測定基準やアクセス数の追跡によって投稿のインパクトを表示します。パートナーシップ用に、これは行われた作業を検証したりより多くの協力を奨励する手助けとなります。


オンでマンド(GLAMorgan)のツールやGLAM組織のコモンズ・カテゴリにより定期的にレポートするものがあります。


あなたはウィキデータ・クエリーを使って網羅率や利用状況のカスタムレポートを作成したいかもしれません。

ツールとスクリプト

PDFファイルを構造化データに変換します。あなたの情報源があまりよく整形されていない場合は、Tabula のようなスクレイピング・ツールを試してみてください。

ツールとスクリプト

Sandra FauconnierによるGLAM WIKI 2018カンファレンスでのOpenRefine ビデオ・チュートリアル

ツールとスクリプト

Pattypan は各ファイル用に必要なメタデータを集めるためにスプレッドシートを使ってメディアを一括アップロードするのにいちばんよく使われています。芸術作品、写真、その他メディア用のテンプレートを見つけて、ファイルをオーガナイズするための適切なカテゴリを識別してください。


Quickstatements はスプレッドシートから生成されたCSVの命令でウィキデータの文を作成します。


Mediawiki API はより高度な作業を行う場合に Python (PyWikibot または PAWS)によるプログラミング環境を提供しています。

ツールとスクリプト

プロパティ完成度の追跡:

Wikidata:WikiProject sum of all paintings/Property statistics - User:Multichill Githubにあるスクリプト

InteGraality - User:Jean-Frédéric ウィキデータの特定の部分に対するプロパティの網羅率のカスタム・ダッシュボードを生成するスクリプト。

Metropolitan Museum of Art向けのプロパティのダッシュボード

Wikimedia Commons Data Roundtripping プロジェクトとレポート

ツールとスクリプト

Infoboxのチュートリアル:

Wikidata:Infobox_Tutorial - ウィキデータと連携したウィキメディア及ぼその他プロジェクト向けの、ウィキデータを元にした情報ボックスやその他テンプレートの作成方法

コモンズのカテゴリ上のウィキデータ駆動の情報ボックス:

Template:Wikidata Infobox - 作者者 User:Mike Peel

ツールとスクリプト

メトロポリタン美術館のウィキデータへのオープンアクセス貢献に関する統計を表示するウィキデータのクエリー:

PAWS notebook by User:Fuzheado

ケーススタディ

  • あなたのケースをここに追加してください

リンク

  • Data and media partnerships workflow - データ及びメディアのパートナーシップに対する全般的な考察、ウィキデータ及びウィキメディア・コモンズ用の一連のツールも含む。