A tecla de acesso 'n' salta para outro local na navegação da página. Saltar para o início do conteúdo.
Este documento é uma tradução. Se ocorrerem discrepâncias ou erros, o original em inglês mais recente terá precedência. Os direitos autorais originais pertencem à W3C, como indicado abaixo.
Tradutor: Maurício Samy Silva
Como posso verificar as informações sobre codificação de caracteres enviadas no cabeçalho HTTP de um documento web?
É muito importante indicar claramente a codificação de caracteres (charset) de um
documento servido na Web. Se tal indicação não for feita, o agente receptor do documento poderá interpretá-lo de maneira incorreta. Um navegador, por
exemplo, poderá mostrar caracteres aleatórios tornando um texto ilegível. Uma das maneiras de se indicar a codificação de caracteres de um documento
é colocando tal informação no parâmetro charset do cabeçalho Content-Type.
Existem várias maneiras de se verificar como foi servido um documento Web:
Pode-se usar um dos vários serviços online, que mostram os cabeçalhos HTTP e o código fonte (HTML/XHTML) de um documento, bastando que você entre com o endereço do documento a verificar:
Nota: O W3C não tem qualquer tipo de vínculo com estes serviços.
Nos cabeçalhos HTTP, procure pelo cabeçalho Content-Type, e em particular pelo parâmetro charset, por
exemplo:
Content-Type: text/html; charset=utf-8
Nota: O parâmetro charset poderá estar ausente. Isto é perfeitamente normal se estiver indicado no próprio documento a
codificação de caracteres.
Para verificar o código de marcação de um documento, o serviço de validação da marcação precisa decodificar o documento corretamente. Caso não haja informação sobre a codificação ou as informações sejam conflitantes ou ainda se não for possível decodificar com a informação fornecida, o validador retornará uma mensagem de erro.
Para saber qual foi a codificação detectada pelo validador, você deverá usar a extended interface (interface extendida do validador). Nesta interface, você poderá ainda marcar a
opção de exibir o código fonte e então verificar visualmente se o código foi corretamente interpretado. Isto é útil para verificar se você
usou uma codificação correta. Nem sempre é possível verificar mecanicamente se, por exemplo, um documento evocando uma codificação
iso-8859-1 foi codificado segundo a iso-8859-2 ou outra qualquer codificação.
telnet ou outra ferramenta linha de comandoEsta maneira requer mais experiência, contudo pode ser facilmente automatizada. Uma ferramenta via linha de comando pode ser
wget (com as opções -S ou -s).
Alguns servidores transcodificam documentos Web com diferentes codificações de caracteres de acordo com o cliente a que servem. Isto acontece, por exemplo, com alguns servidores da Rússia. Aqui se requer um cuidado especial, pois para um navegador rodando em ambiente Mac ou em ambiente Windows haverá conflito com a codificação de um serviço online ou com o serviço de validação da marcação do W3C (os quais são baseados em sistemas UNIX) .
Dê-nos a sua opinião (em inglês).
Traduzido de conteúdo em inglês datado de 2005-08-15. Última versão traduzida modificada 2006-11-25 19:21 GMT
Para obter o histórico de alterações do documento, faça uma busca por qa-headers-charset no blog da i18n.
Copyright © 2003-2006 W3C® (MIT, ERCIM, Keio), All Rights Reserved. W3C liability, trademark, document use and software licensing rules apply. Your interactions with this site are in accordance with our public and Member privacy statements.