La tecla de acceso 'n' lleva a la navegación de la página. Ir al inicio del contenido.

Este documento es una traducción. En caso de discrepancias o errores, la única versión normativa es el último original en inglés. Los derechos de autor originales corresponden al W3C, como puede verse al final de la página.

Traductor: Spanish Translation Team, Spanish Translation US.

s_gotoW3cHome Internacionalización
 

Etiquetado de texto sin idioma

Audiencia de destino: Los codificadores XML y XHTML/HTML (usando editores o secuencia de comandos), los desarrolladores de sistemas de escritura (PHP, JSP, etc.), los desarrolladores de esquemas (DTDs, XML Schema, RelaxNG, etc.), y todo aquel que necesite saber cómo etiquetar contenido con información sobre idiomas cuando no se aplica ningún idioma.

Pregunta

¿Cómo utilizo etiquetado de idiomas en contenido HTML o XML cuando no conozco el idioma o cuando el contenido es no lingüístico?"

Información preliminar

Siempre debe identificar el idioma humano del texto, cuando es conocido, en HTML o en un formato basado en XML, de manera que las aplicaciones como navegadores de voz, hojas de estilo y similares puedan procesar dicho texto. En formatos basados en XML, generalmente utilizará el atributo xml:lang; y en XHTML/HTML, los atributos lang y/o xml:lang. (Véase Identificación del idioma en XHTML y HTML para consultar detalles sobre etiquetado de idioma en HTML.)

Puede invalidar esa configuración de idioma inicial para la parte del documento que esté en un idioma distinto; por ejemplo, algunas citas en francés en un documento en inglés, mediante el(los) mismo(s) atributo(s) en la porción de texto pertinente.

Suponga que tiene cierto texto que no está en ningún idioma como, por ejemplo, muestras tipo, números de piezas, ilustraciones de datos binarios, etc. ¿Cómo diría que no está en ningún idioma en particular? ¿O qué pasaría en una situación en la que usted extrajera el texto de una base de datos y dicho texto apareciera sin información lingüística?

Respuesta

Hay dos partes relacionadas con esta pregunta. Este artículo utiliza ejemplos con xml:lang, que es la forma recomendada de declarar un idioma en formatos basados en XML.

Cuando el texto es no lingüístico

Utilice la subetiqueta zxx cuando se sabe que el texto no está en ningún idioma.

Esto se aplicaría para texto como muestras tipo, números de piezas, ilustraciones de datos binarios, etc. La definición de zxx en el Registro de subetiquetas de idioma es "sin contenido lingüístico".

Por ejemplo:

<p>Aquí hay una lista de números de piezas: <span xml:lang="zxx" lang="zxx">9RUI34 8XOS12 3TYY85</span>.</p>

Cuando el idioma es indeterminado

Si el formato XML que utiliza lo admite, utilice xml:lang="" o, en cualquier otro caso, utilice xml:lang="und".

Estos valores indican que no podemos determinar, por una u otra razón, cuál es la información adecuada sobre el idioma, o si el texto es no lingüístico. Por ejemplo, podría utilizar xml:lang="" si el texto de la base de datos estuviera incluido en un documento, pero esta base de datos no proporcionara información sobre el idioma y usted no pudiera estar razonablemente seguro acerca de qué idioma es. El efecto sería evitar que se aplique al texto incluido cualquier información sobre idioma declarada en una jerarquía superior de elementos en el documento.

Sin embargo, sólo debería etiquetar texto como indeterminado si no lo puede dejar tal como está. En la práctica, esto significa que sólo debe utilizar este etiquetado xml:lang si el texto indeterminado estuviera incrustado en algún contenido que ya haya estado etiquetado de alguna forma, o si el formato que emplea requiriera el uso de dicho etiquetado en el nivel del documento.

xml:lang="" sólo funciona si el esquema que describe el formato de su documento permite una secuencia vacía como valor de xml:lang. Por ejemplo, dado que los XHTML DTD definen xml:lang de manera tal que el atributo xml:lang no está admitido, no puede utilizar la secuencia vacía en XHTML.

Para quienes saben cómo funcionan los DTD y otros esquemas: El atributo xml:lang toma valores NMTOKEN en el esquema HTML, de manera que no pueden estar vacíos. De ser posible, declare xml:lang como CDATA en su XML DTD para que se admita el valor vacío. Los usuarios de XML Schema confían en el documento de dicho esquema para el espacio de nombres XML.

Implicaciones para XHTML/HTML Para XHTML y HTML, debe utilizar und si necesita expresar la naturaleza indefinida de algún texto incorporado en un documento, dado que (como ya se mencionó) xml:lang="" no está admitido. En la muy infrecuente ocasión en que todo el documento esté en idioma indefinido, es mejor simplemente no declarar el idioma predeterminado del documento.

Lo mismo se aplica al atributo lang en HTML (por la misma razón).

A propósito

Este es el resumen de un análisis en un foro de debate en www-international@w3.org, y de una posterior repetición de aquellas ideas que contaron con los aportes de varias personas.

Martin Dürst señala que se puede redefinir el formato XHTML/HTML dentro del documento para crear una página HTML/XHTML que efectúe la validación mientras utiliza lang="" o xml:lang="". Sin embargo, esto no se recomienda para un uso amplio, debido a que dicho documento ya no se ajusta de manera estricta a XHTML 1.0.

Dinos qué piensas (en Inglés).

Suscripción a feed RSS.

Nuevos recursos

Noticias de la página de inicio

Twitter (Noticias de la página de inicio)

‎@webi18n

Lecturas complementarias

De: Richard Ishida, W3C. Traductor: Spanish Translation Team, Spanish Translation US..

XHTML 1.0 válido
CSS válido
Codificado en UTF-8

Traducido del inglés con fecha 2007-10-30. Traducción modificada por última vez el 2011-05-03 20:44 GMT.

Para ver el historial de cambios del documento, busque qa-no-language en la bitácora de internacionalización.