Pregunta: ¿Cómo puedo verificar la información sobre la codificación de caracteres enviada en el encabezado HTTP de un documento web?
Es importante indicar claramente la codificación de caracteres (charset) de un documento servido en la Web. De lo contrario, es posible que el receptor no interprete correctamente el documento. Un explorador web, por ejemplo, puede mostrar caracteres aleatorios en lugar de texto legible. Una forma de indicar la codificación de caracteres de un documento web consiste en ingresar esa información en el parámetro charset
del encabezado Content-Type
.
En especial, es importante observar que la codificación declarada en el encabezado del HTTP anula todas las declaraciones de codificación en HTML del documento y los archivos CSS.
La herramienta del verificador de internacionalización, desarrollada por W3C, verifica las páginas web en busca de diferentes problemas de internacionalización. También tiene una sección de información que resume la información clave relacionada con la internacionalización a una página más o menos, como codificación de caracteres y declaraciones de idioma, etc. Esta sección le indica si se utiliza una declaración de codificación en el encabezado de HTTP y, si éste es el caso, cuál es la codificación.
El verificador de i18n es en verdad útil, debido a que también le muestra otras declaraciones de codificación en el documento, y levanta una bandera si existen diferencias.
Existen varios servicios que le muestran todos los encabezados HTTP y la fuente (HTML/XHTML) del documento devuelto desde el servidor, después de que usted ingrese la dirección del documento que le interesa:
Nota: W3C no está relacionado con ninguno de estos servicios.
En los encabezados HTTP, busque el encabezado Content-Type
y, en particular, el parámetro charset
. Ejemplo:
Content-Type: text/html; charset=utf-8
Nota: Es posible que el parámetro charset
no esté presente. Esto es correcto si el propio documento indica su codificación de caracteres.
Modern desktop browsers usually contain a set of web developer tools, and they can be used to view HTTP headers of a web document and its related resources. Here's how to do it in major browsers.
Content-Type
header, and in particular for the charset
parameter.Content-Type
header, and in particular for the charset
parameter.telnet
u otra herramienta de línea de comandosEsto requiere un poco más de experiencia, pero puede resultar más fácil de automatizar. Otra herramienta de línea de comandos puede ser wget
(con una opción -S
o -s
).
Algunos servidores transcodifican los documentos web que dan servicio para las diferentes codificaciones de caracteres de los distintos clientes. Esto sucede, por ejemplo, con algunos servidores de Rusia. Esto requiere tener especial cuidado, ya que el explorador, que se ejecuta por ejemplo en Mac o en un sistema Windows, puede indicar el uso de una codificación de caracteres distinta a la provista mediante un servicio basado en la Web o un Servicio de validación de etiquetas W3C (que se basa principalmente en los sistemas UNIX).
Autoría de HTML y & CSS
Configuración de un servidor