La tecla de acceso 'n' lleva a la navegación de la página. Ir al inicio del contenido.
Este documento es una traducción. En caso de discrepancias o errores, la única versión normativa es el último original en inglés. Los derechos de autor originales corresponden al W3C, como puede verse al final de la página.
Traductor: Spanish Translation Team, Spanish Translation US.
Audiencia de destino: todo el que desee obtener un breve resumen con la información más importante sobre codificación de caracteres en HTML y XML. Para más información, siga los enlaces en el texto o vaya a Lectura adicional.
El set de caracteres para documentos para XML y HTML 4.0 es Unicode (también conocido como ISO 10646). Esto significa que los navegadores HTML y los procesadores XML deben operar como si utilizaran Unicode internamente. Pero esto no significa que los documentos deban transmitirse en Unicode. Siempre que el cliente y el servidor se pongan de acuerdo acerca de la codificación, pueden utilizar cualquier tipo de codificación que pueda convertirse a Unicode. Más información en set de caracteres para documentos.
Es muy importante que la codificación de caracteres del documento XML o (X)HTML esté claramente etiquetada, de modo tal que los clientes puedan mapear fácilmente estas codificaciones en Unicode. Esto se puede hacer de varias maneras:
Enviar el parámetro 'charset' del Encabezado Content-Type de HTTP. Ejemplo:
Content-Type: text/html; charset=utf-8
Para ello, usted deberá tener acceso a las configuraciones del servidor o ejecutar su documento mediante una secuencia de comandos (consulte Configuración del parámetro charset de HTTP para más información).
Para XML (incluyendo XHTML), utilice el pseudo atributo de codificación en la declaración de XML que se encuentra al principio de un documento o en la declaración de texto que se encuentra al principio de una entidad. Ejemplo:
<?xml version="1.0" encoding="utf-8" ?>
Hay posibles dificultades que deberá tener en cuenta al utilizar XHTML 1.0 ejecutado como HTML.
Para HTML o XHTML ejecutado como HTML, utilice siempre la etiqueta <meta> dentro de <head>. Ejemplo:
<meta http-equiv="Content-Type" content="text/html;charset=utf-8" >
Para XHTML, coloque una barra al final:
<meta http-equiv="Content-Type" content="text/html;charset=utf-8" />
Para saber cuál es el mejor método para cada tipo de documento (X)HTML, consulte el tutorial Codificaciones y sets de caracteres en XHTML, HTML y CSS.
En los ejemplos antes mencionados, se muestran declaraciones para contenido codificado de UTF-8. Probablemente, ésta sea la mejor opción de codificación en la mayoría de los casos, pero no es la única posibilidad.
Si no se utiliza UTF-8, reemplace el texto utf-8 en los ejemplos mencionados por el nombre de la codificación que haya elegido. Si lo desea, vea la lista completa de nombres de codificación de caracteres registrados por la Autoridad de Asignación de Cifras en Internet (IANA) (largo). En la práctica, hay algunas codificaciones que son las preferidas, tales como: ISO-8859-1 (Latin-1), US-ASCII, UTF-16, las otras codificaciones de la serie ISO-8859, iso-2022-jp, euc-kr, y otras.
No sólo es importante utilizar las declaraciones de codificación arriba mencionadas en HTTP o en el contenido, sino también:
Guardar los datos en la codificación adecuada desde su entorno de edición.
Asegurarse de que no hay conflicto entre lo que usted declara en el documento y lo que el servidor aplica automáticamente, dado que las configuraciones del servidor anulan las declaraciones que contiene el documento.
Para obtener más información sobre estos temas, siga los enlaces en Cómo cambiar la codificación de la página (X)HTML a UTF-8. Si bien está escrito desde el punto de vista de UTF-8, se aplica a cualquier codificación que usted utilice.
Los valores para el atributo de codificación pueden encontrarse en el Registro de la IANA. Tenga en cuenta que a estos se los denomina nombres charset, aunque en realidad se refieren a las codificaciones, no a sets de caracteres.
Si desea obtener información detallada relacionada con el término 'charset', consulte el artículo de Dan Connolly ("Character Set" Considered Harmful - "Set de caracteres" considerado perjudicial) y la respuesta de Glenn Adams (Character Set Terminology, SC2 vs. SC18 vs. Internet Standards - Terminología de un set de caracteres; comparación entre SC2, SC18 y estándares de Internet).
Nota histórica: Rick Jellife propuso que se utilicen Entidades SPREAD desde Sintaxis concretas de referencia extendida (ERCS).
Dinos qué piensas (en Inglés).
Traducido del inglés con fecha 2006-07-20. Traducción modificada por última vez el 2009-06-01 17:41 GMT.
Para ver el historial de cambios del documento, busque article-O-charset en la bitácora de internacionalización.
Copyright © 31 May, 1996-2009 W3C® (MIT, ERCIM, Keio, Beihang), All Rights Reserved. W3C liability, trademark, document use and software licensing rules apply. Your interactions with this site are in accordance with our public and Member privacy statements.