La tecla de acceso 'n' lleva a la navegación de la página. Ir al inicio del contenido.

Este documento es una traducción. En caso de discrepancias o errores, la única versión normativa es el último original en inglés. Los derechos de autor originales corresponden al W3C, como puede verse al final de la página.

Traductor: Spanish Translation Team, Spanish Translation US.

s_gotoW3cHome Internacionalización
 

Codificación de caracteres

Audiencia de destino: todo el que desee obtener un breve resumen con la información más importante sobre codificación de caracteres en HTML y XML. Para más información, siga los enlaces en el texto o vaya a Lectura adicional.

El set de caracteres para documentos

El set de caracteres para documentos para XML y HTML 4.0 es Unicode (también conocido como ISO 10646). Esto significa que los navegadores HTML y los procesadores XML deben operar como si utilizaran Unicode internamente. Pero esto no significa que los documentos deban transmitirse en Unicode. Siempre que el cliente y el servidor se pongan de acuerdo acerca de la codificación, pueden utilizar cualquier tipo de codificación que pueda convertirse a Unicode. Más información en set de caracteres para documentos.

Declaración de codificaciones

Es muy importante que la codificación de caracteres del documento XML o (X)HTML esté claramente etiquetada, de modo tal que los clientes puedan mapear fácilmente estas codificaciones en Unicode. Esto se puede hacer de varias maneras:

Para saber cuál es el mejor método para cada tipo de documento (X)HTML, consulte el tutorial Codificaciones y sets de caracteres en XHTML, HTML y CSS.

En los ejemplos antes mencionados, se muestran declaraciones para contenido codificado de UTF-8. Probablemente, ésta sea la mejor opción de codificación en la mayoría de los casos, pero no es la única posibilidad.

Si no se utiliza UTF-8, reemplace el texto utf-8 en los ejemplos mencionados por el nombre de la codificación que haya elegido. Si lo desea, vea la lista completa de nombres de codificación de caracteres registrados por la Autoridad de Asignación de Cifras en Internet (IANA) (largo). En la práctica, hay algunas codificaciones que son las preferidas, tales como: ISO-8859-1 (Latin-1), US-ASCII, UTF-16, las otras codificaciones de la serie ISO-8859, iso-2022-jp, euc-kr, y otras.

Cómo asegurarse de que funcionen las declaraciones

No sólo es importante utilizar las declaraciones de codificación arriba mencionadas en HTTP o en el contenido, sino también:

Para obtener más información sobre estos temas, siga los enlaces en Cómo cambiar la codificación de la página (X)HTML a UTF-8. Si bien está escrito desde el punto de vista de UTF-8, se aplica a cualquier codificación que usted utilice.

A propósito

Los valores para el atributo de codificación pueden encontrarse en el Registro de la IANA. Tenga en cuenta que a estos se los denomina nombres charset, aunque en realidad se refieren a las codificaciones, no a sets de caracteres.

Si desea obtener información detallada relacionada con el término 'charset', consulte el artículo de Dan Connolly ("Character Set" Considered Harmful - "Set de caracteres" considerado perjudicial) y la respuesta de Glenn Adams (Character Set Terminology, SC2 vs. SC18 vs. Internet Standards - Terminología de un set de caracteres; comparación entre SC2, SC18 y estándares de Internet).

Nota histórica: Rick Jellife propuso que se utilicen Entidades SPREAD desde Sintaxis concretas de referencia extendida (ERCS).

Dinos qué piensas (en Inglés).

Suscripción a feed RSS.

Nuevos recursos

Noticias de la página de inicio

Twitter (Noticias de la página de inicio)

‎@webi18n

Lecturas complementarias

Artículos introductorios útiles:

Referencias en especificaciones:

Otros enlaces:

De: Bert Bos, W3C. Cambiado por: Martin J. Dürst, W3C; Richard Ishida, W3C. Traductor: Spanish Translation Team, Spanish Translation US..

XHTML 1.0 válido
CSS válido
Codificado en UTF-8

Traducido del inglés con fecha 2006-07-20. Traducción modificada por última vez el 2009-06-01 17:41 GMT.

Para ver el historial de cambios del documento, busque article-O-charset en la bitácora de internacionalización.