Varför bör jag använda språkattributet i webbsidor?
Attributet lang
(eller ibland xml:lang
)
anger det naturliga språk i vilket en webbsidas innehåll är formulerat.
Om attributet anges på taggen html
så gäller det språket för all text på sidan.
Om någon del av sidan använder text uttryckt i något annat språk,
så kan man, på det element som omger texten ifråga, lägga till ett
språkattribut med ett ett värde som anger detta språk.
Mer information om hur språkattributet ska används finns i Declaring language in HTML.
Genom att du identifierar det språk som ditt innehåll är uttryckt i, så kan ett antal olika saker hanteras automatiskt: att ändra din sidas utseende och beteende, extraktion av information, ändra sättet på vilket en tillämpning fungerar, etc. Vissa användningar av språkinformation fungerar på dokumentet som helhet, medan andra fungerar på lämpligt etiketterade dokumentfragment.
Du gör bäst i att redan nu lägga till språkinformation till ditt innehåll, för att kunna dra nytta av de mervärden som skapas av nyutveckling. Det är enkelt att göra detta när innehåll skapas, men mer omständligt att i efterhand lägga till den.
Vi ger här en lista av några av de sätt på vilket information om språk för närvarande kan ge mervärde. Du bör vara medveten om att i takt med att teknologispecifikationer och webbläsare vidareutvecklas så kan nya användningsområden för språkinformation uppstå.
Med angivande av språkattribut kan du anpassa formatering av ditt innehåll per språk. Mer information om hur man åstadkommer detta finns i Styling using the lang attribute.
Till exempel kan det finnas behov av att anpassa fonter eller radavstånd då olika alfabet används, citationstecken som skapas genom formatering kan se olika ut i olika språk, betoningar kan behöva uttryckas på språkberoende sätt, etc.
Följande exempel visar hur du kan ange en specifik font för arabisk text som är inbäddad i en sida.
Ett annat exempel på språkberoende effekter är avstavning.
Avstavningsregler är mycket språkberoende. Beskrivningen av egenskapen hyphens
i CSS (som just nu börjar få stöd i webbläsare) säger
”Korrekt automatisk avstavning kräver en avstavningsresurs
som är lämpligt för den text som skall avstavas.
Webbläsaren (UA) behöver därför
endast automatiskt avstava sådan text som författaren har angett
språk för
(t.ex. via användning av
HTML:s lang
eller XML:s xml:lang
)
och för vilka det finns en lämplig avstavningsresurs.”
Andra funktionaliteter för typografi och layout som också påverkas av språk är radbrytning, justering och konvertering mellan stora/små tecken, samt annat som definieras i specifikationer under utveckling.
Webbläsare (UA:er) kan använda (och i vissa fall använder) språkinformation för att välja fonter lämpliga för givet språk, vilket förbättrar användarens allmänna upplevelse av sidan.
Så kan t.ex. en sida representerad i Unicode innehålla text i språk som förenklad kinesiska, traditionell kinesiska, japanska och koreanska, och de kan alla använda samma Unicode-kodpunkt för ett visst tecken, men vana läsare av sådana språk förväntar sig att tecknen ska ha något olika utseende i olika språk. Om skaparen av innehåll inte explicit angett formatering, så kan vissa webbläsare automatiskt välja lämpliga fonter för innehållets språk. I bilden nedan visas hur text presenteras, i webbläsare som Firefox och Internet Explorer, då enbart språkattributet varieras.
Fastän automatisk språkigenkänning ofta används av brett använda sökmotorer för att identifiera språket för ett innehåll, så kan uppmärkning inne i sidan förbättra kvalitén hos sökresultat, baserat på användarens språkpreferenser.
Översättningsverktyg kan använda språkattributet för att bestämma att sidor eller delar av text är uttryckta i ett visst språk, och automatiskt anpassa arbetsflödet eller skydda text från att ändras av översättare i översättningsverktyg.
Språkinformation hjälper även tekniska hjälpmedel som talsyntes och Braille-läsare att skapa användbara resultat. Sådana tillämpningar behöver veta om de kan producera utdata från text, eller om de möjligen behöver byta till ett annat sätt att hantera språk.
W3C:s riktlinjer för tillgänglighet (Web Accessibility Guidelines), som i vissa länder föreskrivs av offentliga policies och regelverk (t.ex. i Storbritannien, genom Disability Discrimination Act) rekommenderar att innehållsspråk anges.
Genom att ange språkinformation för innehåll kan man även få språkberoende bearbetning.
Så kan t.ex. ett skript eller en formatmall i XSLT användas för att utföra olika typer av bearbetningar, såsom:
Kom dock ihåg att när du skapas information, så vet du inte alltid hur människor senare kommer att vilja bearbeta denna information.
Nyttan av att ange språk har ökat under senare år, i takt med att teknologin blivit bättre, och framtida nytta kommer att vara ännu större. I många fall kanske du, när du först skapar ditt innehåll, inte ser vikten av sådana typer av användning av innehåll, med då teknisk funktionalitet växer, så kan detta senare skapa ytterligare värde. Vi står dock inför en hönan-och-ägget-situation. De som inte förstår användning av språkinformation, kommer heller inte att ange språk för sitt innehåll. Språkberoende tillämpningar får bred användning först då sådan information faktiskt anges i innehåll. Denna ömsesidiga låsning kan brytas om innehållsförfattare börjar rutinmässigt ange språkinformation. Ju mer innehåll som märks upp med språk, på ett korrekt sätt, desto mer nyttiga och brett använda kommer språkberoende funktionalitet att bli. Det är enkelt att lägga till språkinformation, och det ger inga negativa konsekvenser
Nybörjare? Language on the Web
Tutorial, Working with language in HTML
Näraliggande länkar, Att författa i HTML & CSS