W3Cにおける音声・マルチモーダルインタフェースへの取り組み

http://www.w3.org/2006/Talks/0906-ka-mmi/

Kazuyuki Ashimura <ashimura@w3.org>
6 Sep., 2006

Heraklion Afternoon

発表内容

まず,はじめに

W3Cをご存知ですか?

World Wide Web Consortium [W3C]

Webの相互運用性確保のために必要な,
各種標準仕様および指針の策定に取組む,
会員制の国際的産業コンソーシアム

ホスト

W3Cを共同運営する,3つの研究機関

W3C 慶應ホスト

W3Cの東アジア地区担当ホスト

オフィス

世界中の各国,各地域における,標準化活動の普及推進拠点

標準化の重要性(1): 乾電池

互換性・相互運用性: いつでも,どこでも入手可能

Dry battery

標準化の重要性(2): 電子メール

Standardization for E-mail

標準化の重要性(3): そしてWeb技術

Standardization for Web

標準化の重要性(4): さらに携帯端末など

近年の電子機器は:

→開発コスト高騰,製品不良のリスク増大
→共同開発などによる,コスト削減&開発期間短縮
→ハードおよびソフトに関する,国際標準の重要性増大

W3Cによる国際標準化の取り組み

W3Cは:

W3Cの組織: W3C = Member + Team

W3C Member (W3C 会員)
W3CのWeb技術標準化に賛同し会員登録する各種組織
現在 420組織 (うち日本会員は35組織)
W3C Team (W3C Team スタッフ)
仕様策定に関わる作業を支援,監督する技術的専門家, および組織運営・広報・システムサポート担当者
MIT, ERCIM,もしくは 慶應 という,3ホストのいずれかに所属
現在66名(うち慶應ホストには10名)
W3C Members and the Team

ワーキンググループ(WG)による仕様策定活動

具体的な技術仕様やガイドラインの策定を行う活動の最小単位

→会員からの技術者とTeamからの技術スタッフで構成
W3C's WG Structure Diagram

Team Contact の業務

WGの活動の支援:

W3C ワーキンググループ

W3C's Organizational Diagram, with WG dependencies

WGには世界中から技術者が参加

効果的なコミュニケーション手段の組合せ:

W3C Recommendation Track

W3Cで策定する各種標準仕様は,以下の6段階を経て,W3C 勧告(Recommendation)として公開される

公開草案初版 (First Public Working Draft; FPWD)
当該の活動領域における仕様策定を W3C 内外に示すために最初に公開される草案で,W3C 特許方針に基づく特許請求除外期間が設定される
草案 (Working Draft; WD)
FPWD から LCWD に至る過程で更新される草案で, LCWD CR, PR の段階で問題が生じた場合に差し戻されることもある
最終草案 (Last Call Working Draft; LCWD)
一通り技術的な問題を解決して仕様が固まり WG 内で合意が得られた最終草案で,これ以降は技術的な変更は行われない
勧告候補 (Candidate Recommendation; CR)
実装試験期間
勧告案 (Proposed Recommendation; PR)
会員による投票期間
勧告 (Recommendation; Rec)
技術統括責任者 (Director) である Tim Berners-Lee の承認を経て勧告として公開される

W3Cの活動への参加方法

W3Cは会員制の産業コンソーシアム:

W3C会員

会員組織の規模に応じた3種別:

→規模に応じて年会費は異なるが, 会員としての権利は同一

W3C年会費

2006年1月以降に日本会員として登録した場合の年会費額

Full Member
総収入が年間 230億円 (23,000,000,000 JPY) かそれ以上の営利組織
会費年額: 730万円 (7,300,000 JPY)
Intermediate Member
総収入が年間 57億5000万円 (5,750,000,000 JPY) かそれ以上かつ 230億円 (23,000,000,000 JPY) 未満の営利組織
会費年額: 292万円 (2,920,000 JPY)
2005年4月から2008年中までの3年間だけの暫定措置で, この期間中に新たに20組織が Intermediate Member として会員登録すると, 正式に運用されることになる
Affiliate Member
非営利組織及び上記に当てはまらない組織 (営利組織を含む)
会費年額: 73万円 (730,000 JPY)

特許に関する留意点

仕様策定にあたって本質的な技術 (Normative Technology) は:

→各WGに参加登録する時点で,Royalty Free Licenseへの同意が必要
Royalty Free Licence

音声・マルチモーダル技術に関する仕様策定

Voice Browser WG および Multimodal Interaction WG の取り組み:

Voice Browser WG

Web技術と音声技術の統合 (Speech Interface Framework):

Speech Interface Framework

Voice Browser WG の活動

参加者:

策定対象の仕様:

会議:

情報共有

SSML (Speech Synthesis Markup Language) の国際化対応

Global な利用による,Web コンテンツの爆発的増加:

→SSMLの更新版である SSML 1.1 の策定に着手

SSMLの国際化に関するワークショップ

SSML 1.1 策定に必要な,課題の洗い出し:

→音声言語の特徴を表現する様々な情報を標準へ追加する必要性
  1. 音調
  2. 音節単位での強勢やアクセント
  3. 音の長さ,など

Multimodal Interaction WG

Webを, GUI, 音声, 画像, ペン入力, ジェスチャー, 触覚など, 多様なアクセス方法に対応:

Speech Interface Framework

Multimodal Interaction WG の活動

参加者:

策定対象の仕様:

会議:

情報共有

多様なアプリケーションへの対応

マルチモーダル・アプリケーションの実現には:

日本の技術と国際標準

我が国における,音声・マルチモーダル対話技術標準化の例:

→独自に行なった標準化ノウハウをW3Cへフィードバック

JEITA 音声入出力方式標準化委員会

2005年11月,北京で開催された第1回SSMLワークショップで,日本語音声合成に関するノウハウを提案:

ISTC MMI 記述言語検討ワーキンググループ

ISTC委員の研究開発成果にもとづく,MMI記述言語の策定:

→今後,W3C 会員である豊橋技術科学大学によりW3Cへ提案(?)

W3Cの国際標準化活動にご参加ください!

考えられる効果・メリット:

→開発・メンテナンスコストの抑制,情報収集,宣伝効果

お問合せ先 (ご質問や W3C への参加希望等)

慶應義塾大学 SFC 研究所 W3C
〒252-8520 神奈川県藤沢市遠藤 5322
電話: 0466-49-1170
Fax: 0466-49-1171
email: keio-contact@w3.org
担当: 平川,小野塚,芦村

関連情報

このスライド:

予稿集原稿:

W3C全般について:

Voice Browser WGについて:

音声合成記述言語 SSML について

Multimodal Interaction WGについて:

標準仕様策定について

特許方針について