A tecla de acesso 'n' salta para outro local na navegação da página. Saltar para o início do conteúdo.

Este documento é uma tradução. Se ocorrerem discrepâncias ou erros, o original em inglês mais recente terá precedência. Os direitos autorais originais pertencem ao W3C, como indicado no final da página.

Tradutor: Maurício Samy Silva

s_gotoW3cHome Internacionalização
 

Quem usa Unicode?

Público alvo: Codificadores XHTML/HTML (usando editores ou scripts), gerentes de projetos para web, desenvolvedores de scripts (PHP, JSP, etc.), e qualquer um interessado No uso de codificação Unicode.

Tradução atualizada: 2010-09-20 09:54

Pergunta

Os sites estão usando Unicode atualmente?

Informações

Nesse artigo usa-se o termo Unicode como forma abreviada para uma codificação Unicode.

Supõe-se que codificação Unicode é um termo popular "por trás das cenas", mas na prática é raramente usado nas páginas da maioria dos sites.

Resposta

A versão inicial desse artigo, criada em 2003, apontava para as home pages dos seguintes sites que usavam Unicode àquela época, demonstrando que essa codificação vinha crescendo:

Um post do Google em janeiro de 2010 indicava que quase 50% da Web em seus arquivos de vários bilhões de páginas estavam usando Unicode. De acordo com o Google aquela porcentagem foi ultrapassada em agosto de 2010. Considerando as páginas em ASCII (uma vez que ASCII é um subconjunto de UTF-8) aquela porcentagem cresce para algo próximo dos 70%.

A codificação usada é UTF-8. Páginas codificadas em UTF-16 atingem a porcentagem de 0.01%.

Em 2010 podemos citar como exemplos de uso de codiifcação Unicode as maiores redes sociais, tais como, Facebook, Flickr, Linked-In e Twitter.

Para verificar a codificação de um site use a funcionalidade "codificação" do seu navegador (a figura a seguir demonstra o uso no Internet Explorer):

Figura mostrando os menus padrão do Internet Explorer para inspeção da codificação de caracteres

A propósito

Muitas companhias estão usando Unicode "por trás das cenas", isto é, nos seus conteúdos de banco de dados. Por exemplo; o conteúdo no banco de dados manipula todo o texto em Unicode e quando este conteúdo é passado para o servidor web é decodificado pela codificação nativa.

Você pode colocar um selo de validação (patrocinado pelo Consórcio Unicode) se a sua página validar para UTF-8 no validador do W3C..

Dê-nos a sua opinião (em inglês).

Subscreva uma alimentação RSS.

Novos recursos

Notícias na página principal

Twitter (Notícias na página principal)

‎@webi18n

Leitura complementar

Autor: John Yunker, Byte Level Research. Modificado por: Richard Ishida, W3C. Tradutor: Maurício Samy Silva.

XHTML 1.0 válida!
CSS válido!
Codificado em UTF-8!

Traduzido de conteúdo em inglês datado de 2010-09-02. Última versão traduzida modificada 2010-09-20 09:54 GMT

Para obter o histórico de alterações do documento, faça uma busca por qa-who-uses-unicode no blog da i18n.