A tecla de acesso 'n' salta para outro local na navegação da página. Saltar para o início do conteúdo.
Este documento é uma tradução. Se ocorrerem discrepâncias ou erros, o original em inglês mais recente terá precedência. Os direitos autorais originais pertencem à W3C, como indicado abaixo.
Tradutor: Maurício Samy Silva, CSS para Web Design
Público alvo: qualquer um interessado em consultar um sumário rápido sobre codificação de caracteres em HTML e XML. Para obter informações mais detalhadas siga os links indicados no título Leitura complementar.
O conjunto de caracteres para documentos XML e HTML 4.0 é Unicode (aka ISO 10646). Isto significa que navegadores HTML e processadores XML comportam-se por padrão (internamente) com uso da codificação Unicode. Contudo, isto não significa que documentos devam ser transmitidos com a codificação Unicode. Desde que agentes de usuário e servidores estejam em concordância, pode ser usada qualquer codificação que possa ser convertida para Unicode. Mais detalhes em document character set.
É muito importante que a codificação de caracteres para qualquer documento XML ou (X)HTML seja claramente indicada, de modo a que os dispositivos do cliente possam facilmente mapear a codificação para Unicode. Esta indicação poderá ser feita das seguintes maneiras:
Usar o parâmetro 'charset' no Content-Type do cabeçalho HTTP. Exemplo:
Content-Type: text/html; charset=utf-8Para que isto funcione você deverá ter acesso às configurações do servidor ou então servir seu documento via script (para maiores informações ver Setting the HTTP charset parameter).
Em XML (inclusive XHTML), usar o pseudo-atributo para codificação na declaração xml no ínicio do documento ou a declaração textual no início da entidade. Exemplo:
<?xml version="1.0" encoding="utf-8" ?> Mas atenção, existem considerações complementares que devem ser levadas em conta quando você servir XHTML 1.0 como HTML.
Para HTML ou XHTML servidos como HTML, você deve usar sempre a tag <meta> dentro da seção
<head> do documento. Exemplo:
<meta http-equiv="Content-Type" content="text/html;charset=utf-8" >Em XHTML, você deverá colocar uma barra "/" no final:
<meta http-equiv="Content-Type" content="text/html;charset=utf-8" />Para uma discussão sobre qual a maneira mais apropriada para um documento (X)HTML consulte um tutorial Character sets & encodings in XHTML, HTML and CSS.
Os exemplos acima mostraram declarações para codificação de conteúdos em UTF-8. Esta parece ser a melhor escolha para a
maioria dos propósitos dos documentos, contudo não é a única possibilidade.
Se você não for usar UTF-8 deverá substituir o texto utf-8 nos exemplos mostrados acima pelo nome da codificação que você
pretende usar. Para informações sobre os nomes das codificações consulte a lista dos nomes
de codificação de caracteres registrados pelo IANA. Na prática algumas poucas codificações são preferidas, tais como: ISO-8859-1
(Latin-1), US-ASCII, UTF-16, e outras constantes da série ISO-8859, iso-2022-jp, euc-kr, e assim
por diante.
É muito importante não só usar a declaração de codificação no HTTP ou conteúdo, mas também:
Gravar os dados usando codificação apropriada no seu ambiente de edição.
Assegurar-se de que não haja conflito entre a declaração que você escreveu no documento e aquela aplicada pelo servidor uma vez que a do servidor tem prioridade sobre todas as demais declarações.
Para maiores informações a respeito siga os links indicados em Changing (X)HTML page encoding to UTF-8. Embora a documentação tenha sido escrita considerando as UTF-8, ela aplica-se a qualquer codificação que você pretenda usar.
Valores para os atributos de codificação podem ser encontrados em IANA registry. Notar que estes são chamados de charset, embora na realidade se refiram à codificação e não ao conjunto de caracteres.
Se você quiser uma visão mais aprofundada deste assunto, leia um artigo de Dan Connolly ("Character Set" Considered Harmful) e a réplica de Glenn Adams (Character Set Terminology, SC2 vs. SC18 vs. Internet Standards).
Nota histórica: Rick Jellife propõe o uso de SPREAD entities das ERCS.
Dê-nos a sua opinião (em inglês).
Traduzido de conteúdo em inglês datado de 2006-07-20. Última versão traduzida modificada 2006-10-26 17:41 GMT
Para obter o histórico de alterações do documento, faça uma busca por article-O-charset no blog da i18n.
Copyright © 1996-2006 W3C® (MIT, ERCIM, Keio), All Rights Reserved. W3C liability, trademark, document use and software licensing rules apply. Your interactions with this site are in accordance with our public and Member privacy statements.