Idiomas na Web

Esta páxina proporciona unha guía para os que acaban de chegar á internacionalización da Web e que non saben realmente por onde comezar. O obxectivo é facilitarlles o acceso a algúns dos contidos do sitio web.

Pódese atopar unha selección de artigos máis detallados nas ligazóns da dereita. Unha vez se teñan claros os coñecementos xerais desta páxina, probablemente só se usará o índice de técnicas ou a procura no sitio.

De que se trata?

Os formatos baseados en HTML e XML permiten declarar a linguaxe natural (é dicir, a linguaxe humana no lugar da linguaxe do programa) dun documento ou dunha serie de textos, de xeito que as ferramentas e as aplicacións poden empregar esa información para tarefas sensibles á linguaxe. Isto inclúe desde como aplicar fontes axeitadas ou outros estilos, como cambiar a voz en función de "texto a voz", e ata o corrector ortográfico, etc.

Cantos máis contidos se etiqueten e se faga correctamente coa información do idioma máis útiles e omnipresentes serán estas aplicacións.

Tamén é posible utilizar a información do idioma proporcionada por un navegador ou axente de usuario para garantir que, cando exista unha opción, os usuarios reciban os datos no seu idioma preferido.

Máis información...

O artigo Por que usar o atributo idioma? explica en detalle por que os autores e desenvolvedores de contidos deben declara-lo idioma.

Declarar o idioma

Os autores de contido precisan saber como declarar o idioma dun documentos ou texto na tecnoloxía Web coa que están a tratar. HTML emprega o atributo lang, pero pode haber outras formas de marcaxe. Por exemplo, a maioría dos formatos baseados en XML, como XHTML, SVG, SSML, etc., empregan o atributo xml:lang definido pola especificación XML.

Os autores de contido deben considerar se é preciso facer unha diferencia entre declarar o idioma dun documento ou fragmento de texto, para que poida ser procesado polas ferramentas, ou declarar o obxectivo ó que vai dirixido un recurso (é dicir, os metadatos). É posible que se deban aplicar enfoques lixeiramente diferentes para estes en HTML, por exemplo. Tamén haberá que evitar confundir as declaracións de idioma cos scripts e as declaracións de codificación de caracteres.

Os autores de contido e os webmasters terán tamén que saber cómo usar os valores dos idiomas de forma estándar. O enfoque estándar actual para as especificacións da W3C é empregar as regras contidas en BCP 47. Isto substitúe ás especificacións anteriores, como a RFC 3066 e a RFC 1766 e vai alén da información dispoñible na linguaxe ISO e nas normas nacionais. Tamén se debe utilizar o Rexistro de Subetiquetas de Idioma de IANA para procurar etiquetas de idioma, no lugar das especificacións ISO.

É posible que os webmasters ou os profesionais que traballan na configuración do servidor tamén teñan que configurar o servidor para que envíe xunto cos arquivos solicitados a información HTTP relacionada co idioma. Isto faise normalmente como parte da negociación de contido, onde o servidor envía ó usuario unha das varias versións dispoñibles dun documento dependendo da configuración do navegador do usuario.

Navegar polos sitios web utilizando a información do idioma

Cando se realiza unha solicitude HTTP a un servidor, o cliente adoita enviar información sobre as preferencias do idioma. O servidor pode empregar esa información para devolver unha versión do documento no idioma apropiado de existir tal alternativa.

Os usuarios finais deben saber como comprobar que as súas preferencias de idioma estean configuradas correctamente e como cambialas de non estalo.

Os webmasters deben saber como configurar o seu servidor para xestionar a negociación de contidos en función do idioma.

Os deseñadores e desenvolvedores de sitios web que traballen con sitios web multilingües deben pensar en como guiar os visitantes cara ós recursos adecuados.

Uso da información do idioma para os estilos

Na maioría de navegadores pódese utilizar CSS para aplicar diferentes estilos de acordo co idioma dun fragmento de texto. Por exemplo, dentro dun documento en inglés pódeselle asignar, ó texto tailandés incrustado, unha fonte determinada e os axustes de altura de liña adecuados, en calquera lugar onde apareza; polo feito de etiquetar o contido como tailandés.

En CSS, os desenvolvedores de follas de estilo poden empregar selectores coa propiedade content, alí onde sexa posible, para indicar automaticamente o dioma de destino dunha ligazón.

Máis información...

Máis información

Autores de HTML & CSS

Deseño da información do idioma en formatos de marcaxe

Os desenvolvedores de especificacións de marcaxe, como Schema, deberán considerar se o formato que están a desenvolver inclúe marcaxe, para permitirlles ós autores identificar o idioma principal do documento ou calquera cambio no idioma dentro do documento.

Os desenvolvedores de especificacións de marcaxe, como Schema, deben ter tamén claro cando será axeitado utilizar xml:lang en formatos baseados en XML e cando deben crear un atributo ou elemento diferente para especificar a información do idioma.

Máis información...

Schema developers