平川 泰之

W3C 2007912 (日本時間)
World Wide Web Consortium (W3C)
マサチューセッツ工科大学計算機科学人工知能研究所
欧州情報処理数学研究コンソーシアム
慶應義塾大学 SFC 研究所
報道発表一覧 | RSS

GRDDL の公開について (W3C 勧告)

高度なデータ統合や再利用のための仕組みを Web コンテンツに導入し、HTMLmicroformatsSemantic Web との懸け橋となる GRDDL の標準化を完了

(also available in English and Français; see also translations in other languages)

W3C 会員組織による推薦状も併せてご覧下さい。


http://www.w3.org/ — 2007911 — World Wide Web Consortium (W3C) は本日、Semantic Webmicroformats の両コミュニティを繋ぐ重要な懸け橋の構築を完了いたしました。「グリドゥル (griddle) 」と呼ばれる「派生言語からの情報記述集録」を意味する GRDDL (Gleaning Resource Descriptions from Dialects of Languages) に対応したソフトウェアを用いることで、構造化された Web ページ内の情報を、Semantic Web に基づく情報として自動的に抽出できるようになります。普段から microformats を用いて XHTML 内に構造化されたデータを記述している方であれば、既存のデータを Semantic Web にも対応するよう記述し直すことで、最小限の労力で、それら既存のデータの価値を向上できます。

W3C 技術統括責任者を務める Tim Berners-Lee は次のように述べています。「たった1行の記述が、大きな変化をもたらすこともあります。スタイルシートを利用することで、利用者が Web ページを閲覧しやすくなったのと同様、GRDDL を利用することで、より多くのデータに対して新たな利用機会や創造的な再利用の可能性を広げ、Semantic Web アプリケーションが、Web ページ、microformat タグ、XML 文書、データ等にアクセスしやすくなります。」

今日の Web におけるデータ入出力

"Web 2.0" とも称される最近の技術開発は、Web 上に遍在する多種多様なデータを組み合わせる「マッシュアップ」という手法に基づくアプリケーションにも関係しています。Web の革新を牽引する多くの活発なコミュニティでは、スケジュール帳、連絡先、位置情報といったデータを共有したいという共通の目標を掲げています。これらのコミュニティでは、コミュニティ固有の要求を満たす様々な社会的実践や技術開発を行っています。実際、写真を共有している利用者らが、共有したい写真に手作業で付与した短い文字列の有効性に気付くのと相前後して、統計的な手法を用いた検索エンジンは大成功を収めています。今回標準化された仕様の大部分は microformats に基づいています。microformats は、HTMLCSSXML など、広範に普及する既存の標準に基づく簡潔でオープンなデータ形式群を参照しています。

この活動の高まりは Semantic Web の本質にも直に通じています。Semantic Web に関わるコミュニティでは、Web の膨大な情報量に対応し、さらに強力なマッシュアップにも対応可能な、より集中的なデータ統合や、より多様なアプリケーションを実現できるよう、Web 上でのデータの品質や入手可能性を改善する方法を追求しています。今回標準化された仕様は、Semantic Web 階層を構成する Web 標準仕様群に基づいています。Semantic Web 階層基盤は、銀行取引の管理や膨大な医療データの統合といった、高度なアプリケーション要件にも応えます。

「データ公開」を目的とした、いずれの手法も一定の成果は収めています。しかし何故、最小限の労力で複数の手法を用いる方が有益なのにも関わらず、1つの手法しか用いないのでしょうか? また、microformats の利用者はデータのモデル化や検証を必要とする利用方法を検討していますが、より高度なアプリケーションにおいて既存のデータを利用するにはどうすれば良いでしょうか?

柔軟な Web アプリケーションと Semantic Web との懸け橋

GRDDL は、XHTML を始めとする XML 形式で記述されたデータを、Semantic Web に適したデータに変換します。GRDDL を用いることで、共有したいデータを、より厳密なアプリケーションでも利用可能なデータ形式や再変換可能なデータ形式に変換できます。

GRDDL 利用事例では、会合時間の調整、複数の販売店での購入前の情報比較、e-ラーニング向けに wiki の情報を引用、といった多数の実社会での利用事例を通じ、GRDDL の有用性に関する見解がまとめられています。データを Semantic Web に対応させてしまえば、問合せ、推論、他形式への変換を目的に、同様に Semantic Web に対応したリレーショナルデータベース上のデータなど、他のデータとも統合できるようになります。

本仕様を策定した作業部会からは実装報告が行われ、複数の W3C 会員組織からは GRDDL への支持とその実装が表明されています。

本日はこの他、GRDDL に対応するソフトウェア向けの検証事例について取りまとめた GRDDL 検証事例W3C 勧告として公開されています。本作業部会ではまた、GRDDL に対応したファイルから重要なデータを抽出する GRDDL 情報抽出サービスも提供しています。

World Wide Web Consortium [W3C] について

World Wide Web Consortium (W3C) は、会員組織、専任スタッフ、そして一般の皆様が一丸となって Web 標準の策定に取組む国際的なコンソーシアムです。W3C は、Web の長期的な発展を保証すべく設計された Web 標準や指針の策定を通じ、その使命の遂行に努めます。現在までに 400 を超える組織がコンソーシアムの会員となっています。W3C は、日本の慶應義塾大学、フランスに本部を置く欧州情報処理数学研究コンソーシアム (ERCIM)、及びアメリカ合衆国マサチューセッツ工科大学計算機科学人工知能研究所 (MIT CSAIL) の各ホスト機関により共同運営されています。加えて各国地域における普及推進拠点となる W3C 事務局を世界各地に設置しています。詳しくは W3CWeb サイト http://www.w3.org/ をご覧下さい。

本件お問合せ先:
日本、アジア (慶應義塾大学 SFC 研究所) — 平川 泰之, <chibao@w3.org>, +81-466-49-1170
ヨーロッパ、アフリカ、中東 (ERCIM) — Marie-Claire Forgue, <mcf@w3.org>, +33 492 38 75 94 または +33 676 86 33 41
アメリカ、オーストラリア、その他 (MIT CSAIL) — Janet Daly, <janet@w3.org>, +1.617.253.5884 または +1.617.253.2613