Idiomas en la Web

Esta página proporciona una guía para los recién llegados a la internacionalización de la Web que no saben realmente por dónde empezar. El objetivo es facilitarles el acceso a algunos de los contenidos del sitio web.

You can find a selection of more detailed articles using the links to the right. Once you get some ideas from this page, you will probably just use Learn to internationalize, or the site search.

¿De qué se trata?

Los formatos basados en HTML y XML permiten declarar el lenguaje natural (es decir, el lenguaje humano en lugar del lenguaje del programa) de un documento o de una serie de textos, de modo que las herramientas y las aplicaciones puedan utilizar esa información para tareas sensibles al lenguaje. Esto incluye cosas como la aplicación de fuentes apropiadas u otros estilos, cambiar la voz en la función de "texto a voz", el corrector ortográfico, etc.

Cuantos más contenidos se etiqueten y se haga correctamente con información de idioma, más útiles y omnipresentes serán estas aplicaciones.

También es posible utilizar la información de idioma proporcionada por un navegador o agente de usuario para garantizar que, cuando exista una opción, los usuarios reciban los datos en su idioma preferido.

MÁS INFORMACIÓN

El artículo ¿Por qué usar el atributo idioma? explica en detalle por qué los autores y desarrolladores de contenidos deben declarar el idioma.

Declarar el idioma

Los autores de contenido necesitan saber cómo declarar el idioma de un documento o texto en la tecnología Web con la que están tratando. HTML utiliza el atributo lang, pero puede haber otras formas de marcado. Por ejemplo, la mayoría de los formatos basados en XML, como XHTML, SVG, SSML, etc., utilizan el atributo xml:lang definido por la especificación XML.

Los autores de contenido deben considerar si necesitan hacer una diferencia entre declarar el idioma de un documento o fragmento de texto para que las herramientas puedan procesarlo, y declarar la audiencia a la que va dirigido un recurso (es decir, los metadatos). Es posible que deba aplicar enfoques ligeramente diferentes para éstos en HTML, por ejemplo. También debe evitar confundir las declaraciones de idioma con los scripts y las declaraciones de codificación de caracteres.

Los autores de contenido y los webmasters también tendrán que saber cómo utilizar los valores de los idiomas de forma estándar. El enfoque estándar actual para las especificaciones de W3C es utilizar las reglas contenidas en BCP 47. Esto sustituye a las especificaciones anteriores, como la RFC 3066 y la RFC 1766, y va más allá de la información disponible en el lenguaje ISO y las normas nacionales. También debe utilizar el Registro de Subetiquetas de Idioma de IANA para buscar etiquetas de idioma, en lugar de las especificaciones ISO.

Es posible que los webmasters o las personas que trabajan con la configuración del servidor también tengan que configurar el servidor para que envíe con los archivos solicitados, información HTTP relacionada con el idioma. Esto se hace normalmente como parte de la negociación de contenido, donde el servidor envía al usuario una de varias versiones disponibles de un documento dependiendo de la configuración del navegador del usuario.

Navegar por los sitios web utilizando la información del idioma

Cuando se realiza una solicitud HTTP a un servidor, el cliente suele enviar información sobre las preferencias de idioma. El servidor puede utilizar esta información para devolver una versión del documento en el idioma apropiado si existe tal alternativa.

Los usuarios finales deben saber cómo comprobar que sus preferencias de idioma estén configuradas correctamente, y cómo cambiarlas si no lo están.

Los webmasters deben saber cómo configurar su servidor para gestionar la negociación de contenidos en función del idioma.

Los diseñadores y desarrolladores de sitios web que trabajen con sitios web multilingües deben plantearse cómo guiar a los visitantes hacia los recursos adecuados.

Uso de la información del idioma para los estilos

En la mayoría de navegadores, se puede utilizar CSS para aplicar diferentes estilos de acuerdo con el idioma de un fragmento de texto. Por ejemplo, dentro de un documento en inglés, puede asignar al texto tailandés incrustado una fuente determinada y ajustes de altura de línea adecuados en cualquier lugar donde aparezca, simplemente por el hecho de etiquetar el contenido como tailandés.

En CSS, los desarrolladores de hojas de estilo pueden utilizar selectores con la propiedad content, allí donde sea posible, para indicar automáticamente el idioma de destino de un enlace.

Diseño de la información del idioma en formatos de marcado

Los desarrolladores de especificaciones de marcado como Schema deben considerar si el formato que están desarrollando incluye marcado para permitir a los autores identificar el idioma principal del documento y cualquier cambio en el idioma dentro del documento.

Los desarrolladores de especificaciones de marcado como Schema también deben tener claro cuándo es apropiado utilizar xml:lang en formatos basados en XML, y cuándo deben crear un atributo o elemento diferente para especificar la información del idioma.