Commons:題材
デピクター(Depictor)というウェブ版アプリはホスト先が Toolforge で、ウィキメディア・コモンズにゲーム感覚で構造化データの声明を追加できます。これはマニュアルがなくても使えるように設計してありますが、このページで紹介するのはより高次の関数で便利に使えるかもしれません。
チュートリアル
開発哲学
構造化データは素晴らしいのですが、コモンズ収蔵のメディア・ファイル全点に適切な説明文を追加するまで、長い道のりが埋まっていません。説明文の一部は自動で追加できても、最も重要な説明文(P180の描写 )は手動で確認しなければならないのです。ただし理論上 は描写の説明文に使えるデータは多数あります。ウィキデータ項目にリンク済み カテゴリにまとめてあるメディア・ファイルは、たとえ描写の説明文はなくても情報源になりそうです。
単純な方法は、そのカテゴリに関連するウィキデータ項目を参照して、同カテゴリ内のメディアファイル全件に描写の記述を追加するわけです。ところが、この方法だと例外がたくさんあります。
一例として、オランダの著名なサッカー選手ですがルート・フリットのカテゴリを取り上げます(Ruud Gullit)。このカテゴリに含まれるファイルはおよそ 120 件、その多くは課題となる人物の肖像画像です。ただし一部のファイルはルート・フリット当人を表現せず、この人物と「関連のある」ものを描いており、例として所属したFC チェルシーのジャージ (写真) などがあります。写真がルート・フリット当人を「表現した」ものか確認する方法は唯一、(訳注:カテゴリ内の)ファイル全件を手動で調べるしかありません。
幸いなことに画像をまとまりごとに扱うと、その対処はわりあいに迅速にできます。質問点はたった一つで (この画像にルート・フリット本人の姿はあるか?) 簡単だし、ボタン操作は3回だけ:はい、いいえ(yes, no)、そして〈飛ばす〉('skip')は不明な時。これだけ操作方法が簡単なのでバスを待ったりコーヒーブレイク中などのすき間時間でも操作できるように、モバイル版で使いやすいインターフェースの提供も可能性があります。というわけで、Depictor(デピクター)というアプリが誕生しました。
技術的な実装
Depictor is a web-based app written in Javascript using the Vue.js framework and PHP on the backend. At the heart of the system is the process used to serving up candidate images and candidate items. An item is a Wikidata item that has an attached image (P18). A candidate image is a media file from Wikimedia Commons that doesn't have a depicts statement for that specific item.
When you're pressing 'start' you're always running a query. By default, this is all people born in a random year. But it's also possible to create more advanced queries. Access these advanced options by clicking on the 'Show advanced options' link. There you'll find three options:
- Birth year. This is the same as the default setting, but allows you to provide a specific year.
- Commons category. By default this will take all media files from a single given category. To search in subcategories enable the checkbox and provide a level of depth. These queries can get slow pretty fast, so start out with 0 or 1 and see if that is enough for your usecase. The 'search subcategories' option will use PetScan underwater for getting the media files.
- SPARQL query. Here you can provide a complex SPARQL query, which will use the Wikidata query service to get a list of candidate items. See the provided example. Note that the variable names given in the example (
?item ?instance ?image ?cat
) are required and can't be changed.
All queries will result in an URL that you can bookmark or share. An option not available in the interface but accessible from the URL is making a query by QID.
問題点
Challenges are used to work together on a specific subject. Think of them as little campaigns for specific subjects, e.g. 'depict all cheeses' or 'depict all female politicians from India'. They have their own leaderboard (challenge edits are still counted on the global leaderboard as well).
To create your own challenge you first need to run a regular advanced query using either a category or SPARQL query. This query needs to result in at least 100 candidate images (for a single category) or 10 items. If you're getting that you'll see a 'Create challenge' button on the bottom of the screen. Otherwise you'll see a notice that a query can't be created.
When pressing the 'Create challenge' button you need to add a title of at least 5 characters and a description of at least 25 characters. Optionally you can add a longer description. After hitting the 'Create challenge' button your challenge is ready to be used.
Your challenge will appear on the front page as well in the list of currently running challenges. Challenges on the front page are sorted by last edit. If you don't want your challenge to appear there any longer you can edit your challenge again and set the checkbox to 'archived'. Your challenge is still accessible from the direct URL, but no longer from the front page. Note that only the original creator of the challenge can edit existing challenges (based on username).
短所と足りない機能
複数のものが足りない、あるいは予想通りには機能していません (2021年11月時点):
- The loading of new images can take up to a second or two. This has two main reasons: thumbnail generation of Commons images is unfortunately slow and outdated (see this mailing list message for the technical details). The other reason is that writing a structured data statement is also slow. This could be sped up by rewriting the tool so that edits are done asynchronously, but that takes quite some effort and might lead to other problems, so this will not be done in the near future.
- コモンズの特定のカテゴリ内のファイル全件が〈完了〉したら、デピクター Depictor のデータベースに完了済みの印がつきます。つまり画像がこのカテゴリに新規に追加されても表示されないという意味です。この状態を修正するには、定期的にカテゴリ類を点検する手続きにより、本当に〈完了〉したかどうか確かめます(例えばすべての項目に描写の記述があるかどうか)。
- A 'not depicted' click in the tool will save the result in the database and the image won't show up again. However, that an item is not depicting something isn't saved on Commons because there is no way to indicate using structured data that a statement is not true. Unfortunately there is no easy way to fix this except if the Wikibase data model is changed to support negative or inverted statements or we find another solution.
- 課題を〈アーカイブ〉できるのはそれを書いた人だけなので、〈解決済み〉の課題なのにホームページにずっと表示される場合があります。
- 特定の表現文(depicts statement)を明確に示さなければならないと示すことは不可能です。
- iOS で Safari の利用者はときどき強制ログアウトになりますが、原因不明です。
連絡先とリンク類
Depictor に関して問題や改善点に気づいたりコメントがある場合、連絡先は:
- ここで Depictor を使って見る。
- 質問はトークページに投稿してください。
- バグやコードの改善は、 GitHubで問題提起を始めてください。 プロジェクトソースへの直接リンクはこちら。
- 執筆者に直接、連絡するには利用者ページやウィキメールもしくは旧Twitterをご利用ください。
- Depictor をみなさんの言語に翻訳してください。