Verificación de la codificación de caracteres mediante el verificador

Pregunta

¿Cómo puedo verificar que la codificación de caracteres de mi documento es correcta mediante el verificador W3C HTML?

Respuesta

Para asegurar que todos los destinatarios de un documento puedan mostrarlo e interpretarlo adecuadamente, es muy importante indicar de manera correcta la codificación de caracteres ('charset'). Una forma de verificar esto es utilizar el Servicio de validación de etiquetas W3C. El verificador generalmente detecta la codificación de caracteres a partir de la información y los encabezados HTTP en el documento. Si el verificador no logra detectar la codificación, ésta se puede seleccionar en la página de resultados del verificador mediante el menú desplegable 'Codificación' (ejemplo).

Sin embargo, con frecuencia el verificador no hace ningún reclamo, incluso si se detecta o se selecciona una codificación errónea. La razón de esto es que numerosas codificaciones son muy similares y el verificador sólo controla la sintaxis de la etiqueta y no puede decidir si el texto decodificado tiene sentido o no. Para asegurarse de que tiene la codificación correspondiente, lo que significa que los lectores podrán visualizar el documento en forma correcta, los siguientes puntos le serán útiles:

A propósito

El verificador no funciona sin información sobre codificación de caracteres, ya que la validación SGML o XML se basa en la verificación de secuencias de caracteres del documento, pero lo que verificador recibe como dato ingresado es sólo una secuencia de bytes. Conocer la codificación de caracteres permite al verificador realizar la conversión de bytes a caracteres. En general, sucede lo mismo para todas las demás clases de receptores, incluso exploradores. Si no se identifican los caracteres correctos, es posible que el explorador web muestre garabatos.

El verificador hace esto mediante la conversión de la codificación indicada a UTF-8 y el uso de UTF-8 internamente. Si no es posible realizar la conversión a UTF-8 debido a que una secuencia de bytes en particular no puede aparecer en la codificación ingresada, el verificador muestra un mensaje de error. En el caso de los datos ingresados de UTF-8, el verificador controla para asegurarse de que sólo se utilicen las secuencias de bytes válidas de UTF-8.

Tenga en cuenta que la inspección visual de una página web con un explorador, pero sin utilizar el verificador, puede fallar debido a las siguientes causas: