Språk på webben

Denna sida ger information till de som är nybörjare inom internationalisering för webben, och som inte har klart för sig hur man kommer igång. Målet är att på ett enkelt sätt beskriva en del av det material som finns på denna webbplats.

You can find a selection of more detailed articles using the links to the right. Once you get some ideas from this page, you will probably just use Learn to internationalize, or the site search.

Vad handlar det om?

Med HTML och XML-baserade format kan man deklarera det naturliga språket (dvs det mänskliga språket och inte programmeringsspråket) för ett dokument eller en del av texten, så att verktyg och tillämpningar kan använda den informationen för språkberoende bearbetning. Detta innefattar sådant som att använda lämpliga typsnitt eller annan formatering, att byta språk vid transformering av text till tal, stavningskontroll, etc.

Ju mer innehåll taggas, och taggas korrekt, med språkinformation, desto mer nyttiga och användbara blir då dessa tillämpningar.

Det går även att använda språkinformation från webbläsaren eller annat webbverktyg för att försäkra sig om att, då det finns alternativa språk, så kommer användaren att få information på sitt förstahandsval av språk.

Läs mer ...

Varför deklarera språk? diskuterar lite mer utförligt varför innehållskonstruktörer och -utvecklare bör deklarera språkinformation.

Att deklarera språket

Innehållsutvecklare måste veta hur man deklarerar språk för ett dokument, eller för en del av texten, med hjälp av den webbteknologi de använder. De flesta XML-baserade format, såsom XHTML, SVG, SSML etc. använder attributet xml:lang såsom definierat av XML-specifikationen, men det kan finnas andra sätt att ange språk, såsom attributet lang i HTML.

Innehållskonstruktörer bör ta ställning till om man skall deklarera språket för dokumentet (eller för en del av texten) så att verktyg kan vidtaga rätt åtgärder, eller om man skall ange avsedd målgrupp för en resurs (dvs metadata). Man kan behöva använda något olika ansatser för dessa, t.ex. i (X)HTML. Man måste även särskilja språkdeklarationer från deklarationer av skriptspråk och teckenkodning.

Innehållsutvecklare och webbansvariga måste också veta hur man använder språkkoder i enlighet med standard. För W3C-specifikationer skall man nuförtiden använda de regler som uttrycks i BCP 47. Detta ersätter vad som tidigare sagts i specifikationer som RFC 3066 och RFC 1766, och är mer omfattande än informationen i ISO-standarder för språk och länder. Man bör även använda IANA Language Subtag Registry för att få tag på koder för språk, istället för informationen i ISO-specifikationer.

Webbansvariga eller personer som arbetar med konfigurering av webbservers kan även behöva ställa in servern så att den sänder språkrelaterad HTTP-information tillsammans med de efterfrågade filerna. Detta görs typiskt som del av innehållsförhandling (content-negotiation), då servern kan leverera en av ett antal alternativa versioner av ett dokument, beroende på inställningarna i användarens webbläsare.

Navigera runt på webbplats genom att använda språkinformation

När en server tar emot en HTTP-begäran från en webbläsare, så skickar webbläsaren vanligtvis information om användarens språkpreferenser. Servern kan då använda denna information för att returnera en version av dokumentet i det mest lämpliga språket, om en sådan version finns.

Slutanvändare bör veta hur de kontrollerar att deras preferenser angående språk är korrekt inställda, och hur man annars kan ändra dem.

Webbansvariga bör veta hur man kan konfigurera sin server för att hantera språkbaserad innehållsförhandling.

Webbdesigners och -utvecklare som arbetar med flerspråkiga webbplatser bör tänka på hur man kan hjälpa besökare att hitta de rätta resurserna.

Att använda språkinformation för formatering

I de flesta webbläsare kan man använda CSS-selektorer för att applicera olika formatering beroende på språket för en del av en text. Man kan till exempel inom en engelskspråkigt dokument ha vissa textmassor på Thai, och då kan man få ett speciellt typsnitt och speciellt radavstånd, som en effekt av att innehållet etiketterats med att det är text på Thai.

I CSS kan formatmallsutvecklare använda selektorer med egenskapen content (i de fall det stöds) för att automatiskt ange vilket språk som målet för en länk har.

Att införa språkinformation i uppmärkningsformat

Utvecklare av scheman eller specifikationer bör tänka på om det format de utvecklar gör det möjligt för författare att ange dokumentets huvudsakliga språk, och även förändringar av språk inom dokumentet.

Utvecklare av scheman eller specifikationer bör också vara tydliga med när man kan använda xml:lang i XML-baserade format, och när de bör definiera ett annat attribut eller element för att ange språkinformation.