平川 泰之

W3C 報道発表一覧 | RSS

GRDDL 草案初版を公開

Semantic Webmicroformats の懸け橋となる GRDDL

お問合せ先 (日本、アジア)
平川 泰之, <chibao@w3.org>, +81-466-49-1170
お問合せ先 (ヨーロッパ、アフリカ、中東)
Marie-Claire Forgue, <mcf@w3.org>, +33 4 92 38 75 94 または +33 6 76 86 33 41
お問合せ先 (アメリカ、オーストラリア、その他)
Janet Daly, <janet@w3.org>, +1.617.253.5884 または +1.617.253.2613

(also available in English and Français; see also translations in other languages)


http://www.w3.org/ — 20061024 — World Wide Web Consortium (W3C) は本日、Semantic Webmicroformats の両コミュニティを繋ぐ重要な懸け橋を構築いたしました。「グリドゥル (griddle) 」と発音する「派生言語からの情報記述集録」を意味する GRDDL (Gleaning Resource Descriptions from Dialects of Languages) により、Semantic Web の一部を構成するよう、ソフトウェアが構造化された Web ページから情報を自動的に抽出できるようになります。microformats を用いて XHTML 内に構造化データを容易に記述できる利用者であれば、Semantic Web に基づいてそれらを記述することによって、最小限の労力で、既存のデータの価値を増大させることができます。

W3C では GRDDL ワーキンググループにより策定された本公開草案初版に対するコミュニティの皆様からのご意見をお待ちしております。

求めるものが異なれば、記述方法も変わるデータ

"Web 2.0" とも称される最近の技術開発は、Web 上に遍在する多種多様なデータを組み合わる「マッシュアップ」に基づくアプリケーションにも関係しています。Web を革新させている多くの活発なコミュニティでは、スケジュール帳、連絡先、位置情報といったデータを共有したいという共通の目標を掲げています。これらのコミュニティでは、コミュニティ特有の要求を満たす多様な社会的実践や技術開発を行っています。実際、統計的な手法を用いた検索エンジンは大成功を収めましたが、写真を共有したいと思っていた利用者らは、共有したい写真に手作業で短い文字列をタグ付けすると有効であることを見出しました。これらの活動の多くは microformats を通じて集約することができます。microformats は、HTMLCSSXML を始めとする広範に普及する既存の標準に基づく簡潔でオープンなデータ形式群を参照しています。

この活動の高まりは Semantic Web の本質にも直に通じています。Semantic Web に関わるコミュニティでは、より集約的なデータ統合や、より多様なアプリケーションに対しても、Web の規模にも対応できる、さらに強力なマッシュアップを実現すべく、Web 上でのデータの品質や入手可能性を改善する方法を追求しています。これらの活動を支援する Web に基づく標準仕様群は、Semantic Web 階層を構成する仕様群としても知られています。Semantic Web 階層基盤は、銀行取引の管理や膨大な医療データの統合といった、要求度の高いアプリケーションに対する要件も満たします。

「データを公開する」ことを目的とした、いずれの手法も一定の成果は収めています。しかし何故、最小限の労力で複数の手法を用いる方が利益が得られるにも関わらず、1つの手法しか用いないのでしょうか? また、microformats の利用者はデータのモデル化や検証が必要となる更なる利用について検討していますが、より要求度の高いアプリケーションにおいて既存のデータはどうすれば利用できるでしょうか?

柔軟な Web アプリケーションと Semantic Web との懸け橋

GRDDL は、XHTML などの XML 形式で記述されたデータを、Semantic Web に適したデータに変換します。GRDDL を用いることによって、共有したいデータを、より厳密なアプリケーションでも利用可能な、あるいは、再変換可能なデータ形式に変換できます。

先頃公開された GRDDL 利用事例では、会合時間の調整、購入前に複数の販売店での情報比較、e-ラーニング向けに wiki からの情報抽出、といった多数の利用事例を通じ、GRDDL の有用性に関する見解がまとめられています。データが Semantic Web の一部となれば、問い合わせ、推論、他形式への変換を目的に、同様に Semantic Web 向けに公開可能なリレーショナルデータベースのデータなど、他のデータとの統合も実現します。

GRDDL 入門では、ごくありふれた microformats を用いた XHTML 文書を対象とした「GRDDL の使い方」を幾つかの実践例とともに指南しています。GRDDL の採用に際し、現状のデータ記述における影響は、既存の文書に対しても僅かな変更のみとなり、最小限にとどめられます。それ故、GRDDL は最小限の労力で利用できます。

World Wide Web Consortium [W3C] について

World Wide Web Consortium (W3C) は、会員組織、専任スタッフ、そして一般の皆様が一丸となって Web 標準の策定に取組む国際的なコンソーシアムです。W3C は、Web の長期的な発展を保証すべく設計された Web 標準や指針の策定を通じ、その使命の遂行に努めます。現在までに 400 を超える組織がコンソーシアムの会員となっています。W3C は、日本の慶應義塾大学、フランスに本部を置く欧州情報処理数学研究コンソーシアム (ERCIM)、及びアメリカ合衆国マサチューセッツ工科大学計算機科学人工知能研究所 (MIT CSAIL) の各ホスト機関により共同運営されています。加えて各国地域における普及推進拠点となる W3C オフィスを世界各地に設置しています。詳しくは W3CWeb サイト http://www.w3.org/ をご参照下さい。