W3C 2008 10 14 (日本時間)
World Wide Web Consortium (W3C)
マサチューセッツ工科大学計算機科学人工知能研究所
欧州情報処理数学研究コンソーシアム
慶應義塾大学 SFC 研究所
報道発表 一覧 | RSS

音声対応 Web アプリケーションの作成をより簡単にするW3C標準

Pronunciation Lexicon Specification による発音情報の再利用により、音声アプリケーション作成のコスト削減が可能に

(also available in English and Français; see also translations in other languages)

W3C 会員組織による 推薦状も併せてご覧下さい。


http://www.w3.org/ — 2008年10月14日 — World Wide Web Consortium (W3C) は本日、音声対応 Web アプリケーションの開発を簡単にする標準仕様をW3C勧告として公開いたしました。 音声対応 Web アプリケーションにより、利用者はシステムに音声で話しかけ、またシステムからの反応を音声として聞き取ることができるようになります。 Pronunciation Lexicon Specification (PLS) 1.0 仕様(以下、PLS)は、音声を利用したWebアプリケーションの作成を支援するための基本的アーキテクチャである、W3C音声インタフェース・フレームワークを構成する最新の要素であり、PLSにより発音辞書の共有や再利用が可能となり、音声対応Webアプリケーションの開発コストを削減することが可能となります。さらに、PLSを利用し発音情報に関する問題をアプリケーションの他の部分と分割することにより、音声対応アプリケーションをより簡単に、様々な国語へ対応させることが可能となります。

Loquendo社の国際標準化活動責任者であり、PLS 1.0 仕様の編集者でもあるパオロ・バッジア (Paolo Baggia) 氏は、 「標準的な発音辞書は、W3C音声インタフェース・フレームワーク(以下、本フレームワーク)を完成させる、最後の構成要素です。」 と述べています。 「今まで本フレームワークに不足していた、重要な構成要素の作成に積極的に貢献することができ、大変うれしく思っています。 PLSにより本フレームワークが完成した結果として、まさに本日から、みなさんは『100%標準準拠の』音声アプリケーションを作成することができるようになったわけです。」

音声対話処理の観点から見た、W3Cの「One Web」構想

近年、音声対応 Web アプリケーションは、実社会において多種多様な場所で利用されています。利用者は必ずしも Web サービスと対話していることを意識してはいませんが、例として、航空フライトの発着情報、銀行口座の操作、電話による自動的な予約確認、そして自動化された各種の電話応答が挙げられます。 ある見積りによれば、電話を利用した対話的音声応答システム(IVR)のためのアプリケーションの、実に85%以上が W3C の標準仕様であるVoiceXML 2.0 を利用しているといわれています。

「世界中には、ネットワークに接続されたパーソナル・コンピュータの 10 倍以上の数の電話が存在しており、今後、電話は、まさに Web アクセスのための主たる手段となるでしょう。」 と、この新しい標準仕様を作成した W3C 音声ブラウザ作業部会 の共同議長である ジム・ラーソン (James A. Larson) 氏は語ります。 「音声認識技術は、今のところまだ広範囲な分野において『視覚的な Web』と結びつけられて利用されてはいません。しかしながら、モバイル・デバイスは常に小型化し続け、キーボードを利用することは非現実的になりつつあります。 また、携帯電話は、識字率の低い地域においてもますます一般的に利用されるようになりつつあり、今後は(視覚重視から音声兼用へと)状況が変わっていくと思われます。」

運転中に道順をコンピュータに尋ね、その答を音声合成による応答音声として聞き取るという利用例が、モバイル・アプリケーション利用者にとって「ハンズフリー (手で送受信機を保持する必要がないこと)」がいかに実用的かを物語っています。 音声対応アプリケーションは、また、視覚等に障害のある方や、文字を読むことができない利用者にとっても有益と考えられます。

W3C は、音声による情報へのアクセスを、さらに一般的な「マルチモーダル・アクセス」の一例であるととらえています。 「マルチモーダル」技術により、利用者は音声入力、音声出力、電子的インク、手書き入力、(テレビゲームで用いられるような)身振り手振りなど、対話的操作のために、様々な方法を組み合わせて利用することができるようになります。 音声ブラウザ作業部会およびマルチモーダル・インタラクション作業部会は、協調して Web をより多くの装置上で、そしてより多様な状況において利用することができるように務めています。

World Wide Web Consortium [W3C] について

World Wide Web Consortium (W3C) は、会員組織、専任スタッフ、そして一般の皆様が一丸となって Web 標準の策定に取組む国際的なコンソーシアムです。W3C は、Web の長期的な発展を保証すべく設計された Web 標準や指針の策定を通じ、その使命の遂行に努めます。現在までに 400 を超える組織がコンソーシアムの会員となっています。W3C は、日本の慶應義塾大学、フランスに本部を置く欧州情報処理数学研究コンソーシアム (ERCIM)、及び米国 マサチューセッツ工科大学計算機科学人工知能研究所 (MIT CSAIL) の各運営組織により共同運営されています。加えて各国地域における普及推進拠点となる W3C 事務局を世界各地に設置しています。詳しくは W3CWeb サイト http://www.w3.org/ をご覧下さい。

本件お問合せ先:
日本、アジア (慶應義塾大学 SFC 研究所) — 加藤 文彦, <fumi@w3.org>, +81-466-49-1170
ヨーロッパ、アフリカ、中東 ( ERCIM) — Marie-Claire Forgue, <mcf@w3.org>, +33 492 38 75 94 または +33 676 86 33 41
アメリカ、オーストラリア、その他 ( MIT CSAIL) — Ian Jacobs, <ij@w3.org>, +1.718.260.9447