Consellos rápidos sobre a internacionalización para a Web

Codificación. Utilizar Unicode sempre que sexa posible para contidos, bases de datos, etc. Declarar sempre a codificación do contido.

Escapes. Usar caracteres no canto de escapes (por exemplo, á, á o á) sempre que sexa posible.

Idioma. Declarar o idioma dos documentos e indicar os cambios de idioma internos.

Presentación vs. contido. Utilizar follas de estilo para a información sobre a presentación. Limitar o uso de etiquetas para a semántica.

Imaxes, animacións e exemplos. Verificar, de ser posible, a tradución e a existencia dalgunha influencia cultural inadecuada.

Formularios. Utilizar unha codificación axeitada tanto no formulario coma no servidor. Admiti-los formatos locais de nomes/enderezos, horas/datas, etc.

Autoría de texto. Usar texto simple e conciso. Facer coidado cando se compoñan oracións de cadeas múltiples.

Navegación. Hai que incluir en cada páxina unha navegación que se poda ver de forma clara cara ás páxinas ou sitios localizados, utilizando o idioma de chegada.

Texto de dereita a esquerda. Para XHTML, agregar dir="rtl" á etiqueta html. Usa-la de novo só para cambiar o enderezo de base.

Verifique o seu traballo. Validate! Faga a validación! Utilice as técnicas, os tutoriais e os artigos que se encontran en http://www.w3.org/International/

Os seguintes "Consellos rápidos" resumen os conceptos chave para o deseño Web internacional. Estes consellos non constitúen pautas completas, simplemente son unha serie de conceptos descritos no subsitio Actividade de Internacionalización da W3C.

Esta páxina enumera os consellos en enunciados moi concisos, que tamén aparecen nas tarxetas de referencias do tamaño dunha tarxeta persoal, seguidos dun texto con máis detalles e explicacións. De ser posible, incluiremos tamén algunhas ligazóns ó subsitio Internacionalización da W3C, onde se poderá atopar máis información sobre o tema.

Esta páxina actualizarase periodicamente.

Consellos rápidos

Codificación. Utilizar Unicode sempre que sexa posible para contidos, bases de datos, etc. Declarar sempre a codificación do contido.

A codificación de caracteres seleccionada determinará a forma na que se convirten os bytes en caracteres no texto.

Habitualmente as codificación de caracteres limítano a un sistema de escritura ou a un conxunto de idiomas en particular. Unicode permite utilizar de maneira sinxela practicamente tódolos sistemas de escritura e idiomas usados en todo o mundo. Deste xeito, Unicode simplifica a xestión do contido en múltiples idiomas, xa sexa dentro dunha misma páxina ou a través dun ou máis sitios. Unicode é particularmente útil cando se usan formularios, sistemas de escrituras e bases de datos, nos que, a miúdo, é preciso admitir varios idiomas. Unicode tamén fai que sexa máis sinxelo agregar novos idiomas ó contido.

Salvo que se declare de forma axeitada que codificación de caracteres está a ser usada, é probable que os usuarios non poidan le-lo contido. Isto débese a que posiblemente a aplicación que interpreta o texto realice suposicións incorrectas sobere a maneira na que os bytes pasan a caracteres.

Necesito máis información
En Codificacións de caracteres para principiantes explícanse algúns dos conceptos básicos sobre as codificacións de caracteres e por que lles hai que prestar atención. Introdución ás codificacións e ós conxuntos de caracteres ofrece unha introdución simple ós diversos aspectos do tema.
Daquela, como fago?
Autores de HTML & CSSDesenvolvedores de especificaciónsConfiguración do servidor
Escapes. Usar caracteres no canto de escapes (por exemplo, á, á o á) sempre que sexa posible.

Os escapes, como as referencias de caracteres numéricos (NCR), e as entidades, son formas de representar calquera carácter Unicode na etiquetaxe, empregando únicamente caracteres ASCII. Por exemplo, pódese representar o carácter "á" en HTML como á o á ou á.

Estes escapes son útiles para representar de forma clara os caracteres ambiguos ou invisibles e evitar problemas cos caracteres da sintaxe, coma os signos de "e" e os parénteses angulares. Do mesmo xeito, en ocasións, poden resultar útiles para representar caracteres que non sexan admitidos pola codificación de caracteres usada ou que non estean dispoñibles no teclado empregado. No caso contrario, sempre se deberán utilizar caracteres no canto de escapes.

Uso de entidades de caracteres e NCR ofrece información adicional sobre o uso de escapes nas linguaxes de etiquetas. Hai que ter especialmente en conta que as entidades (como á) deben ser usadas con coidado.

Necesito máis información
Uso de entidades de caracteres e NCR ofrece información adicional sobre o uso de escapes nas linguaxes de etiquetas. Hai que ter especialmente en conta que as entidades (como á) deben ser usadas con coidado.
Daquela, como fago?
Autores de HTML & CSSDesenvolvedores de especificaciónsConfiguración do servidor
Idioma. Declarar o idioma dos documentos e indicar os cambios de idioma internos.

Autores de HTML & CSS • Autores de SVG • Autores de XML • Desenvolvedores de esquemas • Configuración do servidor

A información sobre o idioma (humano) do contido xa é importante por cuestións de accesibilidade, estilo, procura, edicións e outras razóns. A medida que vaia etiquetando máis contido, e sexa etiquetado correctamente, aquelas aplicacións que poidan detectar información sobre o idioma serán cada vez máis útiles e estarán máis estendidas.

Cando se declara o idioma, é posible que se torne preciso ofrecer información sobre o rango específico de contido de maneira distinta dos metadados do documento no seu conxunto. É importante comprender esta distinción.

Necesito máis información
Idioma na Web ofrece unha introdución sinxela ós diversos aspectos do tema.
Daquela, como fago?
Autores de HTML & CSSAutores de SVGAutores de XMLConfiguración do servidor
Presentación vs. contido. Utilizar follas de estilo para a información sobre a presentación. Limitar o uso de etiquetas para a semántica.

Un principio importante do deseño Web é o feito de mante-lo estilo ou a forma de presentar o contido separados do texto en si. Deste xeito é máis doado aplicar estilos alternativos para o mesmo texto como, por exemplo, para presentar o mesmo contido tanto nun explorador convencional coma nun dispositivo manual pequeno.

Este principio é especialmente útil para a localización, dado que os distintos sistemas de escritura teñen distintas necesidades tipográficas. Por exemplo, debido á complexidade dos caracteres xaponeses, pode que sexa conveniente salienta-las palabras nas páxinas X/HTML escritas en xaponés doutro xeito, no canto de empregar a redonda ou a cursiva. É moito máis sinxelo aplicar este tipo de cambios cando se describe a presentación empregando CSS; pois a etiquetaxe ficará moito máis limpa, e será máis doada de manexar, se o texto está etiquetado de maneira correcta e sen ambigüidade como "salientado" no canto de só con "redonda".

Pódese aforrar moito tempo e traballo durante a localización traballando con arquivos CSS no canto de ter que cambia-la etiquetaxe, xa que calquera cambio necesario ha de se poder realizar desde un só lugar para tódalas páxinas, así o tradutor poderase centrar no contido no canto da presentación.

Necesito máis información
Ler as diapositivas pertencencentes ás charlas de presentacións da conferencia @media 2007 "Deseño para usuarios internacionais: Consellos prácticos".
Imaxes, animacións e exemplos. Verificar, de ser posible, a tradución e a existencia dalgunha influencia cultural inadecuada.

Para que o contido chegue realmente ás persoas é preciso fala-la mesma lingua, non só a través do texto, senón tamén con imaxes, cores, obxectos e falar sobre as preocupacións locais. É moi común pasar por alto as caracterícas específicas do simbolismo, do comportamento, dos conceptos, da linguaxe corporal, do humor de cada cultura. É recomendable obte-la opinión dos usuarios locais sobre a adecuación e a relevancia das imaxes, videoclips e exemplos.

Tamén é recomendable incorporar con coidado o texto nos gráficos cando se traduce contido. O texto en contornos complexos ou en espacios restrinxidos pode ser unha fonte de problemas para o tradutor. Deberase proporciona-los gráficos que teñan texto nun nivel separado ó grupo de localización e deberase ter en conta tamén que é probable que o texto en idiomas coma o inglés e o chino se expanda na tradución.

Necesito máis información
Ler as diapositivas pertencencentes ás charlas de presentacións da conferencia @media 2007 "Deseño para usuarios internacionais: Consellos prácticos".
Formularios. Utilizar unha codificación axeitada tanto no formulario coma no servidor. Admiti-los formatos locais de nomes/enderezos, horas/datas, etc.

A codificación empregada para unha páxina HTML que conteña un formulario debe admitir tódolos caracteres necesarios para ingresar datos no devandito formulario. Isto é especialmente importante no caso cando os usuarios precisen ingresar información en varias linguas.

As bases de datos, e os sistemas de escritura que reciben datos de formularios redactados en distintos idiomas, tamén deben ser capaces de admiti-los caracteres para todas estas linguas de forma simultánea.

A maneira máis sinxela de permitir isto é utilizar Unicode para as páxinas que conteñen formularios e para todo o procesamento e a almacenaxe back-end. Neste tipo de contexto o usuario pode ingresar datos en calquera idioma e sistema de escritura que precise.

Do mesmo xeito, deberase evitar realizar suposicións sobre o feito de que o nome de usuario e o enderzo van segui-las mesmas regras de formato que as que foron empregadas. Haise que preguntar canta especificación é precisa e haberá que usar distintos campos para datos como os enderezos. Hai que ter en conta que, nalgunhas culturas, non existen os nomes de rúas e, noutras, o nome da rúa vai logo do número e que, algúns usuarios, precisan máis dunha liña para a parte do enderezo que antecede ó nome da vila ou cidade. De feito, nalgúns lugares, o enderezo escrébese de enriba a abaixo, desde a información máis xeral á máis específica, e isto implica unha estratexia de presentación moi distinta. Hai que ter moito coidado e non establecer suposicións incorrectas sobre a lonxitude dos códigos de área ou dos teléfonos nas rutinas de validación. Tamén cómpre lembrar que é preciso realizar a etiquetaxe con coidado cando se ingresen datos numéricas, xa que existen distintas convencións para a orde do día, do mes e do ano.

De estar a recopilar información de usuarios procedentes de máis dun país é importante desenvolver unha estratexia para responder a tódolos formatos que as persoas esperan poder empregar. Isto non só é importante para o deseño dos formularios que se realicen, senón que tamén afectará a forma na que se almacena esta información nas bases de datos.

Daquela, como fago?
Autores de HTML & CSS
Autoría de texto. Usar texto simple e conciso. Facer coidado cando se compoñan oracións de cadeas múltiples.

O texto simple e conciso é máis fácil de traducir. Ademáis, deste xeito, de non estar redactado o texto na lingua materna, o feito de ser simple e conciso resultaralles máis doado lelo ós usuarios.

Deberase ter moito coidado cando se redacten mensaxes a partir de subcadeas múltiples ou cando se insira texto variable nas cadeas. Por exemplo, supoñendo que no sitio Web se use a linguaxe de escritura JSP e que se decida redactar certas mensaxes de xeito improvisado, poderanse crear mensaxes concatenando distintas subcadeas, como "só" ou "non", "devolver resultados en" e "calquera formato" ou "HTML". Dado que a orde do texto das oracións redactadas noutras linguas pode ser moi distinto, a súa tradución pode presentar problemas importantes.

De maneira semellante é importante evitar fixar posicións das variables no texto, como "páxina 1 de 10". A sintaxe doutras linguas pode requirir que se invertan os números para que o texto teña sentido. De empregar PHP, isto implicará o uso dunha cadea de formato como "Páxina %1\$d de %2\$d.", no lugar da cadea máis simple "Página %d de %d." A última non se pode traducir nalgúns idiomas.

Daquela, como fago?
Autores de HTML e CSS

De ter versións dunha páxina ou un sitio noutra lingua, ou para outro país ou rexión, deberase proporcionar de xeito que o usuario poida ve-la versión que prefira. Esta opción debe estar dispoñible en calquera das páxinas do sitio cando exista unha alternativa.

Cando se proporcionen ligazóns ás páxinas escritas noutras linguas, hai que usar o idioma de chegada no idioma e sistema de escritura nativos. Non se debe asumir que o usuario poida ler en inglés. Por exemplo, nunha ligazón a unha páxina en francés, "Francés" deberase escribir "français". Isto tamén se aplica cando se guía un usuario á páxina ou ó sitio dun país ou unha rexión en particular, por exemplo, "Alemaña" debe aparecer como "Deutschland".

Daquela, como fago?
Autores de HTML e CSS
Texto de dereita a esquerda. Para XHTML, agregar dir="rtl" á etiqueta html. Usa-la de novo só para cambiar o enderezo de base.

O texto en idiomas como o árabe, hebreo, persa e urdu lese de dereita a esquerda. Esta orde de lectura habitualmente dá lugar a texto aliñado á dereita e ó reflexo de imaxes, como na diagramación de páxinas e táboas. Pódese establecer o aliñado predeterminado e ordenar o contido da páxina de dereita a esquerda incluindo dir="rtl" na etiqueta html.

O enderezo establecido na etiqueta html establece un enderezo de base para o documento que se aplica en cascada a tódolos elementos da páxina. Non é preciso repetir o atributo nos elementos de nivel inferior, salvo que se desexe explícitamente cambiar o fluxo direccional.

O texto incrustrado, por exemplo, no sistema de escritura do latín, aínda corre de esquerda a dereita dentro do fluxo xeral de dereita a esquerda. Ocorre o mesmo cos números. De estar a traballar con idiomas que se len de dereita a esquerda, débese estar familiarizado cos conceptos básicos do algoritmo bidireccional Unicode. Este algoritmo ten especial coidado con este texto bidireccional sen requirir a intervención do autor. Existen algunhas circunstancias, porén, nas que se require a etiquetaxe ou o uso de caracteres de control Unicode para acadar o efecto correcto.

Necesito máis información
Unicode Bidirectional Algorithm basics proporciona unha introdución ós conceptos básicos de como funciona o algoritmo bidireccional de Unicode e onde precisa axuda do marcado.
Creación de páxinas (X)HTML en árabe e hebreo ofrece unha introdución simple ós conceptos básicos para o uso do texto que se le de dereita a esquerda en HTML. Os principios son similares ós doutras linguas de etiquetas.
O que hai que coñecer sobre o algoritmo bidi e o uso de etiquetas ofrece unha introdución simple ós conceptos básicos para o uso de texto bidireccional en liña.
Daquela, como fago?
Autores de HTML e CSSAutores de SVGAutores de XMLDesenvolvedores de esquemas
Verifique o seu traballo. Faga a validación! Utilice as técnicas, os tutoriais e os artigos que se encontran en http://www.w3.org/International/
Proba o verificador de Internacionalización da W3C.
 

Outros materiais introdutorios

Temos publicado hai pouco a páxina Introdución para axudar a encontrar información no sitio. Nesta páxina ofrécense unha serie de artigos que estarán dispoñibles proximamente e que brindan ós principiantes unha introdución simple ós temas principais sobre internacionalización e amosan información básica dispoñible no sitio para comezar.