Vem använder Unicode?

Fråga

Används Unicode av webbplatser idag?

Svar

Det kan vara mer intressant att fråga sig vem som inte använder Unicode.

Ett blogginlägg av Google i januari 2012 indikerade att, i deras urval av flera miljarder sidor, redan runt 80% av innehållet använde UTF-8-kodningen i Unicode, om man däri inräknar det som kodats i ASCII (ungefär 16%). ASCII är en delmängd av UTF-8.

I januari 2016 meddelade webbplatsen W3Techs, som inventerar hemsidor för de 10 miljoner mest använda webbplatserna enligt Alexa, att andelen UTF-8-innehåll är 86%.

By January 2021, that figure had risen to 96.1%., and by January 2023 the figure was 97.9%.

Graph of use of encodings over time.
källa Google, 2012

Det är inte bara webbplatsägare som använder Unicode; Unicode är grundläggande för själva webben. Alla webbläsare använder Unicode internt, och konverterar alla andra teckenkodningar till Unicode innan innehållet bearbetas. Även alla sökmotorer använder Unicode. Alla moderna operativsystem utnyttjar Unicode internt. Unicode är en del av webbens infrastruktur.

W3C ger tydliga rekommendationer att författare av innehåll endast bör använda UTF-8-kodningen i sina dokument. Denna rekommendation motiveras delvis av att man bör undvika de säkerhetsrisker som vissa andra kodningar medför, men även för att säkerställa att webbsidor kan användas förutsägbart över hela världen. Unicode ger dig också fler möjligheter för de tecken som du kan ha i dina sidor utan att behöva använda speciella undantagstecken, såsom allt från copyright-symbolen till smileys. Mer råd och information om detta hittar du på sidan om val av teckenkodningar.