Consejos rápidos sobre internacionalización para la Web

Codificación. Utilice Unicode siempre que sea posible para contenidos, bases de datos, etc. Siempre declare la codificación del contenido.

Escapes. Utilice caracteres en lugar de escapes (por ejemplo, á á o á) siempre que sea posible.

Idioma. Declare el idioma de los documentos e indique los cambios de idioma internos.

Presentación vs. contenido. Utilice hojas de estilo para información de presentación. Restrinja el uso de etiquetas para la semántica.

Imágenes, animaciones& ejemplos. Verifique si es posible la traducción y si existe alguna influencia cultural inadecuada.

Formularios. Utilice una codificación adecuada, tanto en el formulario como en el servidor. Admita los formatos locales de nombres/direcciones, horas/fechas, etc.

Autoría de texto. Utilice texto simple y conciso. Tenga cuidado al componer oraciones de cadenas múltiples.

Navegación. Incluya en cada página una navegación que pueda verse claramente hacia las páginas o los sitios localizados, utilizando el idioma de llegada.

Texto de derecha a izquierda. Para XHTML, agregue dir="rtl" a la etiqueta html. Utilícela nuevamente sólo para cambiar la dirección de base.

Verifique su trabajo. ¡Realice la validación! Utilice las técnicas, los tutoriales y los artículos que se encuentran en http://www.w3.org/International/

Los siguientes 'Consejos rápidos' resumen los conceptos clave para el diseño Web internacional Estos consejos no constituyen pautas completas, simplemente son una serie de conceptos descritos en el subsitio Internationalization Activity de W3C.

Esta página enumera los consejos en enunciados muy concisos que también aparecen en las tarjetas de referencias del tamaño de una tarjeta personal, seguidos de un texto que brinda más detalles y explicaciones. Luego incluimos enlaces a la información del subsitio W3C Internationalization, cuando es posible, donde puede obtener más información.

Esta página se actualizará periódicamente.

Consejos rápidos

Codificación. Utilice Unicode siempre que sea posible para contenidos, bases de datos, etc. Siempre declare la codificación del contenido.

La codificación de caracteres que selecciona determina la forma en que se convierten los bytes en caracteres en su texto.

Habitualmente las codificaciones de caracteres lo restringen a un sistema de escritura o a un set de idiomas en particular. Unicode le permite utilizar de manera sencilla prácticamente todos los sistemas de escritura e idiomas que se usan en todo el mundo. De este modo, Unicode simplifica el manejo de contenido en múltiples idiomas, ya sea dentro de una misma página, o a través de uno o más sitios. Unicode es especialmente útil cuando se utiliza en formularios, sistemas de escrituras y bases de datos, en los que, a menudo, es necesario admitir varios idiomas. Unicode también hace que sea mucho más sencillo agregar nuevos idiomas a su contenido.

Salvo que declare adecuadamente qué codificación de caracteres está utilizando, es posible que sus usuarios no puedan leer su contenido. Esto se debe a que es posible que la aplicación que interpreta su texto realice suposiciones incorrectas acerca la manera en que los bytes se convierten a caracteres.

Necesito más información
Codificaciones de caracteres para principiantes explica algunos de los conceptos básicos acerca de las codificaciones de caracteres y por qué debe prestarles atención. Introducción a las codificaciones y a los sets de caracteres le brinda una introducción simple a los diversos aspectos del tema.
Entonces, ¿cómo lo hago?
Autores de HTML & CSS Desarrolladores de especificacionesConfiguración del servidor
Escapes. Utilice caracteres en lugar de escapes (por ejemplo, á á o á) siempre que sea posible.

Los escapes, tales como las referencias de caracteres numéricos (NCR), y las entidades son formas de representar cualquier carácter Unicode en el etiquetado, utilizando únicamente caracteres ASCII. Por ejemplo, puede representar el carácter á en X/HTML como á o á o á.

Estos escapes son útiles para representar de manera clara los caracteres ambiguos o invisibles, y evitar problemas con los caracteres de sintaxis, tales como los signos de "y" y los paréntesis angulares. Asimismo, en ocasiones, pueden resultar útiles para representar caracteres que no son admitidos por su codificación de caracteres o que no están disponibles en su teclado. De lo contrario, siempre deberá utilizar caracteres en lugar de escapes.

Necesito más información
Uso de entidades de caracteres y NCR brinda información adicional acerca del uso de escapes en los lenguajes de etiquetas. Tenga en cuenta especialmente que las entidades (tales como á) deben usarse con cuidado.
Entonces, ¿cómo lo hago?
Autores de HTML & CSS Desarrolladores de especificacionesAutores de SVG
Idioma. Declare el idioma de los documentos e indique los cambios de idioma internos.

La información sobre el idioma (humano) del contenido ya es importante por cuestiones de accesibilidad, estilo, búsqueda, edición y otras razones. A medida que se etiquete cada vez más contenido y que se lo etiquete correctamente, las aplicaciones que puedan detectar información sobre el idioma serán cada vez más útiles y estarán más difundidas.

Al declarar el idioma, es posible que necesite expresar información acerca de un rango específico de contenido de manera distinta de los metadatos del documento en su conjunto. Es importante que comprenda esta distinción.

Necesito más información
Idioma en la Web le brinda una introducción simple a los diversos aspectos del tema.
Entonces, ¿cómo lo hago?
Autores de HTML & CSS Autores de SVGAutores de XMLDesarrolladores de esquemasConfiguración del servidor
Presentación vs. contenido. Utilice hojas de estilo para información de presentación. Restrinja el uso de etiquetas para la semántica.

Un principio importante del diseño Web es mantener el estilo o la forma de presentación del contenido separados del texto en sí. De esta manera, es más fácil aplicar estilos alternativos para el mismo texto, por ejemplo, para presentar el mismo contenido tanto en un explorador convencional como en un dispositivo manual pequeño.

Este principio es especialmente útil para la localización, dado que los distintos sistemas de escritura tienen distintas necesidades tipográficas. Por ejemplo, debido a la complejidad de los caracteres japoneses, quizás sea más conveniente indicar el énfasis en las páginas X/HTML escritas en japonés de otras maneras en lugar de utilizar la negrita o la letra cursiva. Es mucho más fácil aplicar este tipo de cambios si la presentación se describe utilizando CSS y el etiquetado quedará mucho más limpio y será más fácil de manejar si el texto está etiquetado de manera correcta y sin ambigüedad como 'enfatizado' en lugar de sólo con 'negrita'.

Se puede ahorrar mucho tiempo y trabajo durante la localización si se trabaja con archivos CSS en lugar de tener que cambiar el etiquetado, ya que cualquier cambio que sea necesario puede realizarse desde un solo lugar para todas las páginas, y el traductor puede centrarse en el contenido en lugar de la presentación.

Necesito más información
Lea las diapositivas de las charlas de la presentación de la conferencia @media 2007 "Diseño para usuarios internacionales: Consejos prácticos".
Imágenes, animaciones& ejemplos. Verifique si es posible la traducción y si existe alguna influencia cultural inadecuada.

Si desea que su contenido realmente llegue a las personas, es necesario que hable su mismo idioma, no solamente a través del texto, sino también con imágenes, colores, objetos y preocupaciones locales. Es común pasar por alto las características específicas para cada cultura del simbolismo, el comportamiento, los conceptos, el lenguaje corporal, el humor, etc. Le recomendamos obtener la opinión de los usuarios locales acerca de la aptitud y relevancia de sus imágenes, video clips y ejemplos.

También le recomendamos que tenga precaución al incorporar texto en gráficos cuando se traduce contenido. El texto en entornos complejos o en espacios restringidos puede causar muchos problemas para el traductor. Debe proporcionar gráficos al grupo de localización que tengan texto en un nivel separado, y debe tener en cuenta que es muy probable que el texto en idiomas tales como el inglés y el chino se expanda en la traducción.

Necesito más información
Lea las diapositivas de las charlas de la presentación de la conferencia @media 2007 "Diseño para usuarios internacionales: Consejos prácticos".
Formularios. Utilice una codificación adecuada tanto en el formulario como en el servidor. Admita los formatos locales de nombres/direcciones, horas/fechas, etc.

La codificación utilizada para una página HTML que contenga un formulario debe admitir todos los caracteres necesarios para ingresar datos en dicho formulario. Esto es especialmente importante si es probable que los usuarios ingresen información en varios idiomas.

Las bases de datos y los sistemas de escritura que reciben datos de formularios redactados en distintos idiomas también deben ser capaces de admitir los caracteres para todos estos idiomas simultáneamente.

La manera más simple de permitir esto es utilizar Unicode para las páginas que contienen formularios y para todo el procesamiento y almacenamiento back-end. En este tipo de contexto, el usuario puede ingresar datos en cualquier idioma y sistema de escritura que necesiten.

Asimismo, debe tratar de evitar realizar suposiciones acerca de que los datos tales como el nombre de usuario y la dirección seguirán las mismas reglas de formato que las que usted utilizó. Pregúntese cuánto detalle realmente necesita y use distintos campos para datos tales como direcciones. Tenga en cuenta que, en algunas culturas, no existen nombres de calles, en otras, el número de la casa le sigue al nombre de la calle, algunas personas necesitan más de un renglón para la parte de la dirección que antecede al nombre del pueblo o la ciudad, etc. De hecho, en algunos lugares, la dirección se escribe desde arriba hacia abajo, desde la información más general a la más específica, lo que implica una estrategia de presentación muy distinta. Tenga mucho cuidado al establecer suposiciones incorrectas acerca de la longitud de los códigos de área o los teléfonos en rutinas de validación. Recuerde que es necesario realizar con cuidado el etiquetado para el ingreso de fechas numéricas, ya que existen distintas convenciones para el orden del día, el mes y el año.

Si está recopilando información de personas de más de un país, es importante que desarrolle una estrategia para responder a todos los formatos que las personas esperarán poder utilizar. Esto no sólo es importante para el diseño de los formularios que usted realice, sino que también afectará la forma en que almacenará dicha información en bases de datos.

Entonces, ¿cómo lo hago?
Autores de HTML & CSSAutores de HTML & CSSDesarrolladores de especificaciones
Autoría de texto. Utilice texto simple y conciso. Tenga cuidado al componer oraciones de cadenas múltiples.

El texto simple y conciso es más fácil de traducir. Además, a las personas les resultará más fácil leerlo si el texto no está redactado en su idioma materno.

Debe tener mucha precaución cuando redacte mensajes a partir de subcadenas múltiples o al insertar texto variable en las cadenas. Por ejemplo, suponga que su sitio usa el lenguaje de escritura JSP y que usted decide redactar determinados mensajes sobre la marcha. Puede crear mensajes concatenando distintas subcadenas, tales como 'Sólo' o 'No', 'devolver resultados en ', y 'cualquier formato' o 'HTML'. Dado que el orden del texto de las oraciones redactadas en otros idiomas puede ser muy distinto, su traducción puede presentar problemas importantes.

De manera similar, es importante evitar fijar las posiciones de las variables en el texto, como "Página 1 de 10". La sintaxis de otros idiomas puede requerir que se inviertan los números para que el texto tenga sentido. Si utiliza PHP, esto implicaría el uso de una cadena de formato como "Página %1\$d de %2\$d.", en lugar de la cadena más simple "Página %d de %d.". La última no puede traducirse en algunos idiomas.

Entonces, ¿cómo lo hago?
Autores de HTML & CSS
Navegación. Incluya en cada página una navegación que pueda verse claramente hacia las páginas o los sitios localizados, utilizando el idioma de llegada.

Si tiene versiones de una página o un sitio en otro idioma, o para otro país o región, debe proporcionar una manera para que el usuario pueda ver la versión que prefiera. Esta opción debe estar disponible en cualquiera de las páginas de su sitio cuando exista una alternativa.

Cuando proporcione enlaces a páginas escritas en otros idiomas, use el nombre del idioma de llegada en el idioma y sistema de escritura nativos . No asuma que el usuario puede leer en inglés. Por ejemplo, en un enlace a una página en francés, 'Francés' deberá escribirse 'français'. Esto también se aplica si está guiando al usuario a la página o al sitio de un país o una región en particular, por ejemplo, 'Alemania' debe aparecer como 'Deutschland'.

Entonces, ¿cómo lo hago?
Autores de HTML & CSS
Texto de derecha a izquierda. Para XHTML, agregue dir="rtl" a la etiqueta html. Utilícela nuevamente sólo para cambiar la dirección de base.

El texto en idiomas tales como árabe, hebreo, persa y urdu se lee de derecha a izquierda. Este orden de lectura habitualmente da lugar a texto alineado a la derecha y a reflejo de imágenes, como en la diagramación de páginas y tablas. Puede establecer el alineado predeterminado y ordenar el contenido de la página de derecha a izquierda si incluye dir="rtl" en la etiqueta html.

La dirección establecida en la etiqueta html establece una dirección de base para el documento que se aplica en cascada a todos los elementos de la página. No es necesario repetir el atributo en los elementos de nivel inferior, salvo que desee explícitamente cambiar el flujo direccional.

El texto incrustado, por ejemplo, en el sistema de escritura del latín, aún corre de izquierda a derecha dentro del flujo general de derecha a izquierda. Lo mismo sucede con los números. Si está trabajando con idiomas que se leen de derecha a izquierda, debe familiarizarse con los conceptos básicos del algoritmo bidireccional Unicode. Este algoritmo tiene mucho cuidado con este texto bidireccional sin requerir la intervención del autor. Existen algunas circunstancias, sin embargo, en las que se requiere el etiquetado o el uso de caracteres de control Unicode para lograr el efecto correcto.

Necesito más información
Creación de Paginas (X)HTML en árabe & hebreo brinda una introducción simple a los conceptos básicos para el manejo del texto que se lee de derecha a izquierda en HTML. Los principios son similares a los de otros lenguajes de etiquetas.
Qué debe conocer acerca del algoritmo bidi y el uso de etiquetas en línea brinda una introducción simple a los conceptos básicos para el manejo de texto bidireccional en línea.
Entonces, ¿cómo lo hago?
Autores de HTML & CSSAutores de SVGAutores de XMLDesarrolladores de esquemas
Verifique su trabajo. ¡Realice la validación! Utilice las técnicas, los tutoriales y los artículos que se encuentran en http://www.w3.org/International/
Try the W3C Internationalization Checker.

Otros materiales introductorios

Recientemente hemos publicado una página Introducción para ayudarlo a encontrar información en el sitio. La página Introducción indica una serie de artículos que estarán disponibles próximamente y que le brindan a los principiantes una introducción simple a los temas clave sobre internacionalización y señalan información básica disponible en el sitio para que pueda comenzar.