Använd accesskey 'n' för att hoppa till de interna navigationslänkarna i dokumentet. Hoppa till början av innehållet.

Detta dokument är en översättning av ett engelskt orginal. Om det finns tveksamheter eller fel i detta dokument, så är senaste version av det engelska orginalet den auktoritativa versionen. Copyright tillhör W3C, enligt nedan.

Översättare: Olle Olsson, SICS

s_gotoW3cHome Internationalization
 

Introduktion till teckenuppsättningar och kodningar

Avsedd läsarkrets: alla som är nybörjare vad gäller internationalisering, och behöver råd om vad man bör tänka på, och hur man hittar mer information på webbplatsen.

Denna sida ger lite vägledning till de som nyligen stött på internationalisering på webben, och som inte riktigt vet hur man ger sig i kast med detta. Avsikten med denna sida är att på ett lättförståeligt sätt ge ingångar till annat material på denna webbplats.

Via länkarna till höger kan du hitta ett antal mer utförliga artiklar. När du väl fått viss förståelse av materialet på denna sida, så kan du direkt använda ämnesindex, teknikindex, eller helt enkelt söka på denna webbplats.

Vad handlar detta om?

Mer information om ...

Teckenkodning för nybörjare förklarar några grundläggande begrepp om teckenkodning, och varför du bör tänka på sådant.

Teckenkodningar: grundläggande begrepp ger förklaringar av terminologi, som Unicode, teckenuppsättningar, kodade teckenmängder, teckenkodningar, dokuments teckenuppsättning, och specialsekvenser.

En teckenuppsättning är en samling bokstäver och symboler som används i ett skriftsystem. Som exempel kan nämnas ASCII:s teckenuppsättning som innehåller bokstäver och symboler för engelsk text, ISO-8859-6 som är tecken och symboler vilka används i många språk baserade på arabiskt skriftsystem, och Unicodes teckenuppsättning som innehåller tecken för de flesta nu levande språk och skriftsystem i världen.

Tecken i en teckenuppsättning lagras som en eller flera byte i en dator. Varje byte eller sekvens av bytes representerar ett visst tecken. En teckenkodning är en nyckel som avbildar en viss byte eller sekvens av bytes till ett visst tecken, vilket med ett typsnitt kan presenteras som text.

Det finns många olika teckenkodningar. Om en felaktig kodning appliceras på de bytes som finns i datorns minne, så kan resultatet bli oförståelig text. För att människor ska kunna läsa ditt innehåll, så är det viktigt att du anger den teckenkodning som faktiskt används.

Att välja en kodning

Alla som utvecklar innehåll, såväl innehållsförfattare som programmerare, måste fatta ett beslut om vilken teckenkodning som ska användas. Numera rekommenderas användning av UTF-8, men det finns ändå vissa saker du bör tänka på innan du använder den.

Mer information om ...

Arbeta med HTML & CSS
Att välja en teckenkodning

Utvecklare av specifikationer
Att välja teckenkodningar

Konfigurera en server
Att välja en teckenkodning


Deklarera och använda en kodning

När man väl beslutat vilken kodning som skall användas, så måste innehållsutvecklare och programmerare säkerställa att den deklareras på ett korrekt sätt.

Med teknologi som XHTML så finns det en del att tänka på: man måste förstå 'standards' vs. 'quirks' modes, och XML-deklarationens effekter.

Du måste också säkerställa att dina data lagras i den kodning du valt, det räcker inte med att bara etikettera den.

Innehållsutvecklare och webbansvariga måste även fastställa att webbservern levererar innehåll med korrekt deklaration av teckenkodning, eftersom de inställningar som servern anger är viktigare än deklarationer i dokumentet självt.

Specialsekvenser

Specialsekvenser är ett sätt att med ASCII-text representera ett tecken. Med sådana sekvenser kan man representera tecken som inte finns i den teckenkodning du använder, eller då du av andra skäl måste undvika att använda tecknet (t.ex. då det inte tillåts av uppmärkningens syntax). Du bör ha klart för dig under vilka omständigheter dessa specialsekvenser bör användas.


Webbadresser

Idag kan webbadresser även innehålla tecken som inte ingår i ASCII. Användaren behöver inte göra mer än klicka på en länk, eller skriva in den text som de ser - själva jobbet utförs av webbläsaren - men du kan vara intresserad av att veta hur det fungerar.

Utvecklare av specifikationer bör konstruera sina specifikationer så att man kan använda webbadresser vilka innehåller tecken som inte ingår i ASCII.


Av: Richard Ishida, W3C. Översättare: Olle Olsson, SICS.

Översatt från engelskt innehåll skapat/ändrat 2009-05-01. Översättningen senast ändrad 2012-02-28 10:29 GMT

Information om ändringar i orginaldokumentet kan fås genom att söka efter gs-characters i i18n-bloggen.