Le W3C publie VoiceXML 2.0 en Proposition de Recommandation

La spécification centrale de la plate-forme Interface Vocale du W3C est en voie de finalisation

 

http://www.w3.org/ -- 3 février 2004 -- Le Consortium World Wide Web (W3C) donne de la voix sur le Web avec la publication de VoiceXML 2.0 en tant que Proposition de Recommandation W3C. L'objectif de VoiceXML 2.0 est de faciliter l'utilisation des techniques de développement Web pour la mise en place d'applications vocales interactives.

Cette spécification a été revue et commentée à la fois par les groupes de travail du W3C et par la communauté des développeurs. Elle comporte également des tests d'interopérabilité et d'implémentation probants. Il s'agit donc maintenant d'une revue finale du document avant qu'il n'accède au stade de Recommandation W3C, appelé aussi standard Web.

Applications vocales sur le Web, grâce à la plate-forme Interface Vocale du W3C

Le W3C travaille sur la plate-forme Interface Vocale (Speech Interface Framework) depuis 1999 dans le but d'étendre l'accès universel au Web, à l'aide d'interactions de type clavier téléphonique, commandes vocales, annonces préenregistrées, voix et musiques synthétisées. Avec un nombre de lignes téléphoniques et de téléphones portables estimé à plus d'un milliard dans le monde entier, les spécifications de la plate-forme Interface Vocale du W3C vont permettre à un nombre considérable de personnes de pouvoir accéder à des services Web à partir de n'importe quel téléphone.

VoiceXML 2.0 apporte voix et interactivité au sein de la plate-forme Interface Vocale

VoiceXML 2.0 permet aux développeurs de créer des dialogues vocaux utilisant des voix synthétisées, des sons numérisés, de la reconnaissance de parole et de sons DTMF (ou Fréquences Vocales), des messages enregistrés, des communications téléphoniques, ainsi que différents modes de dialogues initiés par le serveur ou l'utilisateur.

« VoiceXML 2.0 modifie la manière dont sont développés les services et informations de téléphonie. Nous n'aurons plus à appuyer sur les touches clavier de notre téléphone, car nous serons capables, avec la parole, de réaliser des sélections et d'envoyer des informations, » explique Dave Raggett, responsable de l'activité Navigateur Vocal du W3C (Voice Browser). « De plus, VoiceXML 2.0 est adapté pour les personnes malvoyantes, ou pour les personnes qui ont besoin d'accéder au Web dans des situations qui ne permettent pas de se servir d'un clavier ou un écran. Un exemple est le fait de pouvoir accéder, tout en conduisant, à un service Web d'aide à la navigation routière. »

Dans le cadre de la plate-forme Interface Vocale du W3C, VoiceXML contrôle les interactions entre une application et un utilisateur, tandis que le Langage de Synthèse Vocale (Speech Synthesis Markup Language - SSML) est utilisé pour générer des annonces vocales synthétiques. Quant aux Grammaires de Reconnaissance de la Parole (Speech Recognition Grammar Specification - SRGS), celles-ci guident la reconnaissance en utilisant la description des réponses possibles de l'utilisateur. La spécification Contrôle d'Appel de Navigateur Vocal (Voice Browser Call Control - CCXML) décrit le contrôle d'appels téléphoniques, par exemple le transfert d'appel, pour VoiceXML ou autres systèmes d'interaction vocale. Enfin, l'Interprétation Sémantique pour la Reconnaissance de la Parole (Semantic Interpretation for Speech Recognition) définit la syntaxe et la sémantique des balises dans les Grammaires de Reconnaissance de la Parole (SRGS).

Adoption notable de VoiceXML 2.0 dans le monde industriel

L'avancement de tout document W3C au stade de Proposition de Recommandation doit être justifié par l'existence d'au moins deux implémentations interopérables et indépendantes : il doit être prouvé que les spécifications sont opérationnelles. Dans le cas de VoiceXML 2.0, ce critère est largement dépassé puisqu'on dénombre plus de huit implémentations connues, à la fois au sein de prototypes et de produits disponibles sur le marché. Une liste complète de ces implémentations est disponible.

VoiceXML 2.0 dispose d'une importante collection de tests, dont le nombre devrait dépasser 500 dans sa version finale. Les mises à jour seront annoncées au fur et à mesure dans la liste de diffusion publique 'Voice Browser'.

Ces tests complètent la collection fournie pour la spécification SRGS, document publié en tant que Recommandation Candidate en juin 2002. Les collections de tests correspondant aux autres spécifications faisant partie de la plate-forme Interface Vocale du W3C, comme la spécification Speech Synthesis Markup Language (SSML), sont en cours de développement dans le groupe de travail Navigateur Vocal du W3C, et seront publiées dans les mois à venir.

Poursuite des travaux dans le cadre de la plate-forme Interface Vocale et résolution des difficultés liées aux brevets

Le groupe de travail Navigateur Vocal du W3C est l'un des plus importants et des plus actifs au sein du W3C. Il est composé des Membres suivants : BeVocal Inc. ; Canon ; Comverse ; France Telecom ; Genesys Telecommunications Laboratories ; HP ; HeyAnita ; Hitachi ; IBM ; Intel ; Loquendo ; Microsoft ; MITRE ; Mitsubishi ; Motorola ; Nokia ; Nortel Networks ; Nuance ; Philips ; PipeBeach ; SAP ; ScanSoft ; Snowshore Networks ; SpeechWorks ; Sun ; Syntellect ; Tellme Networks ; Unisys ; Verascape ; VoiceGenie ; Voxeo et VoxPilot.

Des difficultés liées aux brevets inconsistants avec le régime mode libre (Royalty-Free Licensing Mode) du groupe de travail Voice Browser, ont été prises en charge par un Groupe de Conseil des Brevets (Patent Advisory Group), suivant la procédure décrite dans le document Pratique Courante dans la Gestion des Brevets du W3C (W3C's Current Patent Practice). Ainsi, le groupe de travail Navigateur Vocal du W3C s'est engagé à produire une spécification ouverte. Le travail du Groupe de Conseil des Brevets va consister à résoudre les problèmes subsistants, et faire en sorte que la spécification centrale VoiceXML 2.0 soit disponible sous le régime du mode libre du W3C.

A propos du Consortium World Wide Web (W3C)

Le Consortium World Wide Web (W3C) a été créé pour mener le Web à son plein potentiel en développant des protocoles communs qui facilitent son évolution et assurent son interopérabilité. C'est un consortium industriel international, piloté conjointement par le Groupement Européen de Recherche en Informatique et en Mathématiques (ERCIM) basé en France, l'Université de Keio au Japon, et le Laboratoire d'Informatique et d'Intelligence Artificielle du MIT (MIT CSAIL) aux Etats-Unis. Les services fournis par le Consortium se composent de : la constitution et la mise à disposition d'informations concernant le World Wide Web à destination des développeurs et des utilisateurs ; la mise en oeuvre de logiciels permettant d'incorporer et de promouvoir les standards ; la mise en place de diverses applications prototypes visant à démontrer l'utilisation des nouvelles technologies. Aujourd'hui, le Consortium compte près de 400 Membres. Pour plus d'informations sur le Consortium World Wide Web, consulter l'adresse suivante  : http://www.w3.org/.

 

Contacts Presse :

Amériques et Australie -- Janet Daly, <janet@w3.org>, +1.617.253.5884 ou +1.617.253.2613
Asie -- Yasuyuki Hirakawa <chibao@w3.org>, +81.466.49.1170
Europe -- Marie-Claire Forgue, <mcf@w3.org>, +33.492.38.75.94