A tecla de acesso 'n' salta para outro local na navegação da página. Saltar para o início do conteúdo.
Este documento é uma tradução. Se ocorrerem discrepâncias ou erros, o original em inglês mais recente terá precedência. Os direitos autorais originais pertencem à W3C, como indicado no final da página.
Tradutor: Mauricio Samy Silva
Público alvo: usuários, autores XHTML/HTML (usando editores ou scripts), desenvolvedores (PHP, JSP, etc.), gerentes de projeto web e qualquer um que tenha interesse em conhecer como se faz a verificação da codificaçao de caracteres com uso de cabeçalhos HTTP.
Tradução atualizada: 2012-08-14 12:59
Como posso verificar as informações sobre codificação de caracteres enviadas no cabeçalho HTTP de um documento web?
É muito importante indicar claramente a codificação de caracteres (charset) de um documento servido na Web. Se tal indicação não for feita, o agente receptor do documento poderá interpretá-lo de maneira incorreta. Um navegador, por exemplo, poderá mostrar caracteres aleatórios tornando um texto ilegível. Uma das maneiras de se indicar a codificação de caracteres de um documento é colocando tal informação no parâmetro charset
do cabeçalho Content-Type.
Em particular, é importante notar que uma codificação de caracteres declarada no cabeçalho HTTP tem precedência sobre aquelas declaradas no documento HTML e/ou nas CSS.
Existem várias maneiras de se verificar como foi servido um documento Web, entre elas inspecionando-se os cabeçalhos HTTP:
A ferramenta Internationalization Checker tool, desenvolvida pelo W3C faz a verificação de páginas web em vários aspectos que dizem respeito à internacionalização. Ela fornece um sumário com as informações relacionadas aos principais aspectos da internacionalização, tais como codificação de caracteres, declaração de idioma, etc. No sumário você poderá verificar se a declaração de caracteres foi feita no cabeçalho HTTP e qual foi a declaração.
A ferramenta i18n Checker é bastante útil, pois ela mostra também outras declarações de caracteres feitas no documento e alerta caso encontre diferenças.
Pode-se usar um dos vários serviços online, que mostram os cabeçalhos HTTP e o código fonte (HTML/XHTML) de um documento, bastando que você entre com o endereço do documento a verificar:
Nota: O W3C não tem qualquer tipo de vínculo com estes serviços.
Nos cabeçalhos HTTP, procure pelo cabeçalho Content-Type e em particular pelo parâmetro charset como mostrado no exemplo a seguir:
Content-Type: text/html; charset=utf-8
Nota: O parâmetro charset poderá estar ausente. Isto é perfeitamente normal se a codificação de caracteres foi indicada no próprio documento.
Para verificar o código de marcação de um documento, o serviço de validação da marcação precisa decodificar o documento corretamente. Caso não haja informação sobre a codificação de caracteres ou as informações sejam conflitantes ou ainda se não for possível decodificar com a informação fornecida, o validador retornará uma mensagem de erro.
Para saber qual foi a codificação detectada pelo validador, você deverá usar a interface extendida do validador.
Naquela interface, você poderá ainda marcar a opção exibir o código fonte e então verificar visualmente se o código foi corretamente interpretado. Isto é útil para verificar se você usou uma codificação correta. Nem sempre é possível verificar mecanicamente se, por exemplo, um documento evocando uma codificação iso-8859-1 foi codificado segundo a iso-8859-2 ou outra codificação qualquer.
telnet ou outra ferramenta linha de comandoEsta maneira requer mais experiência, contudo pode ser facilmente automatizada. Uma ferramenta via linha de comando pode ser wget (com as opções
-S ou -s).
Alguns servidores transcodificam documentos Web com diferentes codificações de caracteres de acordo com o cliente a que servem. Isto acontece, por exemplo, com alguns servidores da Rússia. Aqui se requer um cuidado especial, pois para um navegador rodando em ambiente Mac ou em ambiente Windows haverá conflito com a codificação de um serviço online ou com o serviço de validação da marcação do W3C (os quais são baseados em sistemas UNIX).
Dê-nos a sua opinião (em inglês).
Subscreva uma alimentação RSS.
Twitter (Notícias na página principal)
Traduzido de conteúdo em inglês datado de 2010-08-28. Última versão traduzida modificada 2012-08-14 12:59 GMT
Para obter o histórico de alterações do documento, faça uma busca por qa-headers-charset no blog da i18n.
Copyright © 2003-2012 W3C® (MIT, ERCIM, Keio, Beihang), All Rights Reserved. W3C liability, trademark, document use and software licensing rules apply. Your interactions with this site are in accordance with our public and Member privacy statements.