« ?b とリテラシー | メイン | ジェフリー・サックス『貧困の終焉―2025年までに世界を変える』 »

June 21, 2006

博物館資料 RDF で統制語彙を使う

分類概念のようなカテゴリカルなデータを値域に持つしくみを調べていて、Representing Classes As Property Values on the Semantic Web を読んでみました。プロパティの値としてクラスを持つような表現のパターンを検討しているのですが、大変参考になりました。博物館資料の場合、カテゴリカルな情報として使いたいのはおそらくいわゆる分類 (絵画、彫刻、工芸、歴史資料…) や技法 (油彩、鍍金、蒔絵、エングレーヴィング…) や、そういったものです。このドキュメントをざっと見ると、approach 1 はシンプルでよさげ、approach 2 は「主題としてのライオン」と「生きたライオン」が混ざるのでイマイチ、approach 3 はオントロジーとシソーラスが2重になるのがイヤじゃなければかなりよさげ、approach 4 はあらかじめクラスをいっぱい作らなくちゃいけないので無理、approach 5 は推論が使えないのでイマイチ。というわで、approach 1 か approach 3 がいいんじゃないかな、と。

OWL DL にこだわるのがどれくらい重要なのかは今の僕にはよくわかりません。なのでむしろ、こういうカテゴリカルな情報を OWL クラス階層として (オントロジーとして) 作るのと、たとえば SKOS を使って用語の階層として (シソーラスとして) 作るのとでどちらのアプローチがこの領域で妥当か、というふうに問題を切りかえてみます。あれ? 切りかえてみたところでやっぱりよくわかりません…。しかし「絵画」とか「彫刻」とか「古文書」とかをオントロジー的に記述していくということを考えると正直メマイがします。とうぶんできそうにありません。それになんかその方向はすごく危険なニオイがする (これ重要)。それよりは、AAT のような実績もあることだし (SKOS Core の例でも使われてますね)、シソーラスのほうが現実的な気がします。「絵画とは何か? それは平面的な形態で人によって描かれたもので…」という哲学談義がしたいのじゃなくて、「絵画」で検索したら「絵巻」も「壁画」も引掛ってほしいだけなのだから。CIDOC CRM だってそういう意味のジャンルは全然無視してるじゃん。だからいいんだよきっと。

だから将来カテゴリカルな情報をある程度高い精度で使うことを考えるなら、SKOS Core なんかを使ってシソーラスを作る方向で考えるのがよろしいと思う。

投稿者 ryoji : June 21, 2006 12:26 AM

トラックバック

このエントリーのトラックバックURL:
http://ryoji.sakura.ne.jp/mt/mt-tb.cgi/323