World Wide Web Consortium publicerar VoiceXML 2.0 som W3C Proposed Recommendation

En av hörnstenarna i W3C:s ramverk för talbaserad interaktion är nästan färdig to the W3C Speech Interface Framework is Nearly Complete

 

http://www.w3.org/ -- 3:e februari 2004 -- Som ett steg i arbetet mot en talande webb har nu World Wide Web Consortium (W3C) publicerat VoiceXML 2.0 som en W3C Proposed Recommendation. Målet med VoiceXML 2.0 är att göra det möjligt att utnyttja webbens i interaktiva talstyrda tillämpningar.

Att ett W3C-dokument har fått status Proposed Recommendation betyder att arbetsgruppen har gått igenom såväl granskning inom W3C som offentlig granskning, och att demonstrerbara interoperabla implementationer tagits fram. Status Proposed Recommendation innebär att den nu genomgår slutgiltig granskning innan den blir W3C Recommendation, det som vi vanligen kallar webb-standard.

Mot en talande webb - W3C:s ramverk för talstyrning

Alltsedan 1999 har W3C arbetat med ett ramverk för tal-baserad interaktion, som ett sätt att låta användare interagera med hjälp av tangentbord/knappsatser, styra via tal, och lyssna på inspelat tal, syntetiskt tal och musik. Eftersom antalet telefoner, fasta såväl som mobila, i världen överstiger en miljard, så kommer W3C:s ramverk för talinteraktion att ge ott ofantligt antal användare möjligheter att få tillgång till lämpligt utformade tjänster på webben.

VoiceXML 2.0 ger röst och interaktivitet till ramverket för tal-baserade teknologi.

VoiceXML 2.0 gör det möjligt för utvecklare att skapa tal-baserade dialoger med syntetiserat tal, digitaliserat ljud, igenkänning av talade och knappstyrda kommandon, inspelning av tal, telefoni och dialoger av typ "mixed-initiave".

"VoiceXML 2.0 förändrar sättet att utveckla telefonbaserade informations- och andra användartjänster. Det är inte längre behövligt att trycka på knappen 'etta' för att få det ena och trycka knappen 'tvåa' för att få det andra. Istället kan vi göra våra val genom att tala dem", förklarar Dave Raggett, ledare av W3C:s aktivitet för Voice Browser. "Dessutom ger VoiceXML 2.0 möjligheter för användare med synhinder och för de som behöver använda webben medan deras händer och ögon är upptagna med andra saker, t.ex. för att få hjälp med vägval medan man kör bil".

I W3C:s ramverk för talinteraktion styr VoiceXML hur en tillämpning interagerar med en användare, medan Speech Synthesis Markup Language (SSML) användes för talad inmatning och Speech Recognition Grammar Specification (SRGS) för att styra taligenkännare m.h.a. grammatiker som beskriver vad användaren förväntas uttrycka. Andra specifikationer i ramverket är t.ex. Voice Browser Call Control (CCXML), som stöder telefonuppringning inom VoiceXML och andra dialogsystem, och Semantic Interpretation for Speech Recognition, som definierar syntax och semantik av uppmärkningsord i SRGS.

VoiceXML 2.0 har redan brett industristöd.

För att en W3C-specifikation skall få status Proposed recommendation måste det finnas ett flertal oberoende implementationer av denna, dvs det måste finnas bevis på att specifikationen tekniskt fungerar. Åtminstone åtta implementationer av VoiceXML 2.0 har utvecklats som prototyper eller fullt fungerande produkter. En fullständig förteckning över implementationer finns dokumenterad.

Det finns en utförlig allmänt tillgänglig testsvit. Den första versionen av denna innehåller över 300 tester, och målet för den slutliga versionen är att den skall innehålla fler än 500 tester. Uppdateringar av testsviten annonseras på Voice Browsers öppna epostlista.

Dessa tester utgör ett komplement till testsviten för Speech Recognition Grammar Specification, som blev W3C Candidate Recommendation i juni 2002. Testsviter för övriga specifikationer i W3C:s ramverk för talbaserad interaktion (bl.a. för Speech Synthesis Markup Language) utvecklas av W3C:s arbetsgrupp för Voice Browser, och de kommer att publiceras under de närmaste månaderna.

VoiceXML 2.0, ramverk för talinteraktion vidareutvecklas, patentfrågor lösta.

W3C:s arbetsgrupp för Voice Browser är en av de största och mest aktiva i W3C. Bland dess deltagare återfinnes BeVocal Inc., Canon, Comverse, France Telecom, Genesys Telecommunications Laboratories, HP, HeyAnita, Hitachi, IBM, Intel, Loquendo, Microsoft, MITRE, Mitsubishi, Motorola, Nokia, Nortel Networks, Nuance, Philips, PipeBeach, SAP, ScanSoft, SnowShore Networks, SpeechWorks, Sun, Syntellect, Tellme Networks, Unisys, Verascape, Vocalocity; VoiceGenie, Voxeo, och Voxpilot.

Patent-relaterade diskussioner som uppstått inom ramen för arbetsgruppens avgiftsfria licensieringsmodell har hanterats av W3C:s Patent Advisory Group i enlighet med W3C:s nuvarande policy för patent. Som ett resultat av detta har arbetsgruppen för Voice Browser kommit överens om att ta fram en öppen specifikation, och Voice Browser Patent Advisory Group arbetade fram lösningar på återstående problem, vilket gjort det möjligt att de centrala delarna av specificationen för VoiceXML 2.0 kan utnyttjas enligt W3C:s avgiftsfria licens.

Om World Wide Web Consortium [W3C]

W3C skapades för att leda webben till sin fulla potential, genom att utveckla gemensamma protokoll som bidrar till webbens utveckling och säkrar dess interoperabilitet. W3C är ett internationellt industri-konsortium som drivs gemensamt av Computer Science and Artificial Intelligence Laboratory (MIT CSAIL) i USA, European Research Consortium for Informatics and Mathematics (ERCIM) med högkvarter i Frankrike, och Keio University i Japan. Bland de tjänster som konsortiet erbjuder finns t.ex. databaser med information om webben, riktat till såväl utvecklare som användare, och olika prototyper och exempeltillämpningar, som demonstrerar användandet av ny teknologi. Idag är närmare 400 organisationer medlemmar i konsortiet. Mer information finns på http://www.w3.org/

 

Kontaktpunkt Amerika, Australien --
Janet Daly, <janet@w3.org>, +1.617.253.5884 eller +1.617.253.2613
Kontaktpunkt Europa --
Marie-Claire Forgue, <mcf@w3.org>, +33.492.38.75.94
Kontaktpunkt Asien --
Yasuyuki Hirakawa <yasuyuki@w3.org>, +81.466.49.1170