平川 泰之

W3C 報道発表一覧 | RSS

音声技術と Web との連携に向けた新たな機能拡張に関する取組みについて

国際化に対応する音声合成記述言語 SSML の改訂版と、発話者照合機能を盛り込む VoiceXML 3.0

お問合せ先 (日本、アジア)
平川 泰之, <chibao@w3.org>, +81-466-49-1170
お問合せ先 (ヨーロッパ、アフリカ、中東)
Marie-Claire Forgue, <mcf@w3.org>, +33 4 92 38 75 94
お問合せ先 (アメリカ、オーストラリア、その他)
Janet Daly, <janet@w3.org>, +1.617.253.5884 または +1.617.253.2613

(also available in English and Français; see also translations in other languages)


http://www.w3.org/ — 2005126 — World Wide Web Consortium (W3C) は、音声インタフェースフレームワークを構成する新たな機能拡張に関する取組みとして、日本語をはじめとするアジア諸国の言語や英語以外のその他の言語において、音声合成記述言語 SSML を効果的に利用できるよう拡張するとともに、VoiceXML の次のバージョンである VoiceXML 3.0 に対し、声紋などを用いたバイオメトリクス (生体認証) 技術の1つとして、セキュリティ対策に活用可能な発話者照合機能の追加にそれぞれ着手します。これらの対象領域に取組むことで、本フレームワークの適用範囲の拡大と機能向上を図ります。

SSML の国際化に取組む W3C 音声ブラウザワーキンググループ

20049月に W3C 勧告として策定が完了した音声合成記述言語 SSML は、Web や他のアプリケーションにおける音声合成を支援する XML に基づく高機能な記述言語です。本記述言語の本質的な役割は、音声合成に対応した様々な基盤環境に依存せずに、発音音量音律発話速度といった、様々な音声の属性を制御するための標準的な手法を、音声合成可能なコンテンツの制作者に提供することにあります。

これらの属性は音声合成を行う上で必要不可欠なものですが、特定の言語によってはより多くの属性が必要とされる場合もあります。今日、全世界で最も話されている言葉である標準中国語の北京語には、同一表記の文字でも音調によって複数の発音や意味を持ち得る四声が存在します。推定で10億台をも超えると言われる中国における膨大な数の携帯電話を勘案すれば、SSML北京語に対応するのは、明白な市場ニーズという点で、もはや必然とも言えます。日本語や韓国語、その他の国や地域の言語への拡張も含め、可能な限りより多くの人が世界中から Web に参加できるようにします。

VoiceXML 3.0 に新たに盛り込まれる発話者照合機能

Web 及び電話サービスに対して利用者らが要求するもう1つの機能として、発話者照合が挙げられます。

W3C 音声ブラウザワーキンググループ参加者で、新たに VoiceXML Forum 議長に選任された VocalocityKen Rehor は次のように述べています。「個人情報の盗難、詐欺、フィッシング、テロ、そして面倒なパスワードの再設定など、電話を含む、あらゆる通信において生体認証を導入する重要性が高まっています。発話者の照合や識別は、安全な通信や通話を確保するための最良の生体認証技術であるだけでなく、VoiceXML の導入により、音声認識や音声合成とともにシームレスに機能します。」

今日まで業界ベンダのほとんどは、特定のサービス向けに個別の変更を加えることで、このような発話者照合の機能を補完していました。その結果、相互運用不可能な統一性のない技術群が乱立してしまっています。VoiceXML Forum 内に設置されている Speaker Biometrics Committee による本機能要件に対する意見集約を受け、W3C 音声ブラウザワーキンググループでは、標準化された発話者照合モジュールの要件を明確化できるようになりました。本ワーキンググループではこれら要件に対する取組みを開始しています。

今こそ新規参加の絶好の機会

VoiceXML 3.0 に新たに盛り込まれる機能も含め、広範で奥行きのある新たな取組みを考慮すれば、今こそが、企業、研究者、あるいはそれ以外の関係者らが新規に W3C に会員参加し、音声技術と Web に対する最新の技術開発に直接参加する絶好の機会に他なりません。世界中の Web 利用者の要求に真に応える標準の策定において最高の専門知識を盛り込むためにも、潜在的で重要な参加協力者の中でも特に、アジア諸国の言語や発話者照合に精通する研究者や業界専門家らのアジア全域からの参加が期待されます。詳しくは W3CWeb サイト内の W3C 音声ブラウザ活動及び W3C へのご参加をそれぞれご参照下さい。

World Wide Web Consortium [W3C] について

W3C は、Web の発展を促進し、相互運用性を保証する共通のプロトコルを開発することにより、Web の可能性を最大限に導き出すべく設立されました。W3C は、日本の慶應義塾大学、フランスに本部を置く欧州情報処理数学研究コンソーシアム (ERCIM)、及びアメリカ合衆国マサチューセッツ工科大学計算機科学人工知能研究所 (MIT CSAIL) がホスト機関として共同運営する会員制の国際産業コンソーシアムです。コンソーシアムにより提供されるサービスには、開発者及び利用者のための World Wide Web に関する豊富な情報、新技術を応用した様々なプロトタイプやサンプルアプリケーションの開発などが挙げられます。現在までに 400 近い組織がコンソーシアムの会員となっています。詳しくは W3CWeb サイト http://www.w3.org/ をご参照下さい。