Le W3C publie la spécification relative à la mise en place de grammaires de reconnaissance de la parole

Invitation à tester une composante essentielle de la plate-forme Interface Vocale du W3C

http://www.w3.org/ -- 26 juin 2002 -- Le Consortium World Wide Web (W3C) publie la spécification sur la mise en place de grammaires pour la reconnaissance de la parole (Speech Recognition Grammar) en Recommandation Candidate du W3C. Ce document permet aux auteurs d'applications vocales de créer des règles décrivant les possibilités de réponses d'utilisateurs après l'écoute de messages d'un serveur vocal.

Le statut de ce document en Recommandation Candidate indique que, d'une part, le document est stable et que, d'autre part, la communauté Web en général est appelée à fournir de nouvelles mises en oeuvre ou implémentations, et à commenter ce document.

Parler et écouter sur le Web requiert un cadre de travail

Le groupe de travail Voice Browser (ou Navigateur Vocal) du W3C définit un ensemble de langages de balises qui comprend : le dialogue avec VoiceXML 2.0, la synthèse vocale avec Speech Synthesis Markup Language, la reconnaissance de la parole avec les grammaires vocales (Speech Grammar), les modèles stochastiques (Stochastic Language Models), l'interprétation sémantique pour la reconnaissance de la parole (Semantic Interpretation for Speech Recognition), la sémantique du langage naturel (Natural Language Semantics), et le contrôle de l'appel avec Voice Browser Call Control: CCXML, ainsi que d'autres aspects relatifs à des applications de réponses vocales interactives. Toutes ces contributions se trouvent au sein de la plate-forme Interface Vocale du W3C.

"Le W3C travaille à l'élargissement de l'accès du Web à plus d'un milliard de téléphones déjà existants dans le monde entier", explique Dave Raggett, responsable de l'activité Voice Browser du W3C et collaborateur W3C d'Openwave Systems. "Les utilisateurs auront la possibilité d'interagir par commande vocale, et aussi d'écouter des voix enregistrées, des voix synthétisées et de la musique. Cela bénéficiera aux personnes ayant des problèmes de vue d'une part, et aux personnes souhaitant accéder au Web en gardant leurs mains et leurs yeux disponibles pour d'autres tâches, d'autre part."

La spécification "Speech Recognition Grammar" est la première des composantes de la plate-forme Interface Vocale du W3C à atteindre le statut de Recommandation Candidate.

Les grammaires de reconnaissance vocale produisent des règles XML pour la compréhension de la parole

Les grammaires de reconnaissance vocale permettent aux auteurs de spécifier des règles qui prennent en compte des séquences de mots que les utilisateurs pourraient dire dans un contexte donné. La spécification définit un langage XML pour les grammaires vocales indépendamment du contexte.

En termes plus pratiques, ces grammaires facilitent les variations dans les réponses des utilisateurs. Par exemple, une personne peut dire "oui", "bien sûr", ou "ok", ou bien préciser une date en disant "demain", "le 8 Juillet", ou "le 8/7". La spécification fournit ainsi un langage XML pour que les auteurs d'applications vocales puissent tenir compte de mots ou de combinaisons de mots selon une situation bien définie.

L'ensemble des règles étant indépendant de tout type de langage de balises, elles peuvent alors être utilisées avec toute version de VoiceXML, ou avec d'autres langages de balises de dialogue.

Les implémentations sont encouragées pour bâtir la plate-forme Interface Vocale

Le W3C accueille favorablement des rapports d'implémentation de la spécification sur la mise en place de grammaires de reconnaissance vocale du W3C. Le plan de rapports d'implémentation, disponible à partir du document, fournit un grand nombre de cas de tests, et montre déjà des mises en oeuvre significatives de la part des membres du W3C impliqués dans le développement de la spécification. Le W3C souhaite au moins deux implémentations interopérables pour chaque fonctionnalité requise par la spécification, ce qui est une condition pour que le document passe en statut de Recommandation Proposée.

Les acteurs clés issus de l'industrie des applications vocales produisent une spécification grâce au système de consensus du W3C

Le groupe de travail Voice Browser du W3C est composé de membres W3C et d'experts invités qui sont des acteurs clés dans le développement des technologies relatives aux interactions vocales sur le Web. Les membres actifs dans le développement de la spécification "Speech Recognition Grammar" sont : BeVocal, Cisco Systems, Comverse, IBM, Locus Dialogue, Lucent, Microsoft, Nuance Communications, Openwave, Philips, PipeBeach, Scansoft, SpeechWorks International, Tellme Networks et Unisys.

A propos du Consortium World Wide Web (W3C)

Le Consortium World Wide Web (W3C) a été créé pour mener le Web à son plein potentiel en développant des protocoles communs qui facilitent son évolution et assurent son interopérabilité. C'est un consortium industriel international, piloté conjointement par l'Institut National de la Recherche en Informatique et en Automatique (INRIA) en France, l'Université de Keio au Japon, et le MIT Laboratory for Computer Science (MIT LCS) aux États-Unis. Les services fournis par le Consortium se composent de : la constitution et la mise à disposition d'informations concernant le World Wide Web à destination des développeurs et des utilisateurs ; la mise en oeuvre de logiciels permettant d'incorporer et de promouvoir les standards ; la mise en place de diverses applications prototypes visant à démontrer l'utilisation des nouvelles technologies. Aujourd'hui, le Consortium compte près de 500 membres. Pour plus d'informations sur le Consortium World Wide Web, consulter l'adresse suivante : http://www.w3.org/.

Contacts Presse:
Ameriques, Australie -- Janet Daly, <janet@w3.org>, +1.617.253.5884 ou +1.617.253.2613
Europe -- Marie-Claire Forgue, <mcf@w3.org>, +33.492.38.75.94
Asie -- Saeko Takeuchi <saeko@w3.org>, +81.466.49.1170