A tecla de acesso 'n' salta para outro local na navegação da página. Saltar para o início do conteúdo.

Este documento é uma tradução. Se ocorrerem discrepâncias ou erros, o original em inglês mais recente terá precedência. Os direitos autorais originais pertencem à W3C, como indicado abaixo.

Tradutor: Portuguese Translation Team, Trusted Translations, Inc.

s_gotoW3cHome Internacionalização
 

Definir a codificação em aplicações de autorização web

Público alvo: utilizadores, codificadores de XHTML/HTML (utilizando editores ou escrita), desenvolvedores de conteúdos e alguém que necessite de algumas dicas sobre como gravar documentos do seu editor numa codoficação específica.

Pergunta

Como defino a codificação de caracteres nas minhas aplicação de autorização web?

Informações

O conteúdo na web pode ser autorizado utilizando uma variedade de aplicações de software. Mesmo num único site, o conteúdo pode ter sido criado utilizando várias ferramentas de autorização. Por exemplo, um site da web que foi criado utilizando o Macromedia Dreamweaver também pode incluir uma página criada utilizando o recurso de página de acesso de dados do Microsoft Access, assim como um filme Flash dinâmico que permita a selecção do idioma. De modo a que todos estes ficheiros sirvam o texto correcto, necessitam de ser codificados adequadamente.

O objectivo deste artigo é identificar onde é que algumas das principais funcionalidades de codificação existem em algumas das aplicações de autorização web mais populares.

Resposta

As opções específicas para configurar as codificações de caracteres variam frequentemente dependendo da versão do utilizador, e assim, estas não são discutidas detalhadamente para cada aplicação. Para obter informações mais detalhadas, consulte o conteúdo de ajuda específico da aplicação ou os manuais do utilizador. Os índices comuns e a pesquisa de palavras-chave incluem Codificação de Caracteres, Internacionalização, Multilingua, Unicode e UTF.

Existem dois pontos principais a recordar quando criar ficheiros codificados correctamente:

  1. A marcação dentro do documento deve designar correctamente a codificação (tais como charset=iso-8859-1 numa meta tag XHTML/HTML, ou encoding="UTF-8" numa frase de declaraçao XML).
  2. O arquivo, propriamente dito, deve ser gravado no formato de codificação apropriado (tal como UTF-8).

A seguir estão alguns pontos a ser considerados quando utilziar estas aplicações:

Recomendamos a utilização da codificação Unicode porque simplifica muito o esforço de criar sites da internet multilíngues.

Adobe FrameMaker 7.0

As opções de codificação existem dentro de HTML Options Table.

Adobe Golive 6 e CS (Mac & Win)

Para especificar a codificação de caracteres para novas páginas, vá para: Edit > Preferences > Encodings category. No GoLive CS (Mac), o Menu Preferences (Preferências) está localizado no menu principal Application (Aplicação) (de acordo com as Especificações Apple)

Para alterar a codificação da página vá para File > Document Encoding. No GoLive CS pode utilizar também Edit > Document Content > Change Encoding....

Apple TextEdit (Mac OS X 10.2)

Irá necessitar de introduzir a marcação de codificação adequada no ficheiro HTML/XHTML. Os ficheiros são gravados inicialmente como UTF-8.

Helios TextPad (Windows)

Será necessária a introdução a marcação adequada no ficheiro da codificação. Quado gravar o documento, o formato adequado do ficheiro pode ser seleccionado aqui. File > Save As > Encoding dropdown menu.

Macromedia ColdFusion (Windows)

Para configurar adequadamente a aplicação ColdFusion, familiarize-se com os vários comandos e funções de codificação (alguns dos quais incluem setEncoding, cfcontent, e o atributo do formato enctype).

Macromedia Dreamweaver MX (Mac & Windows)

Para especificar a codificação de caracteres das suas páginas, vá para Modify > Page Properties. Seleccione a codificação adequada no menu Document Encoding dropdown menu..

Para também necessitar de especificar a codificação de caracteres para visualizar as páginas durante a edição: Vá para Edit > Preferences > Fonts category (Dreamweaver > Preferences > Fonts category no Mac).

Macromedia Flash MX (Mac & Windows)

Quando concebidos eficazmente, os filmes Flash multilingues armazenam muitas vezes o texto para cada idioma em ficheiros separados incorporados (#include), reduzindo o tempo necessário para descarregar um filme flash enviando apenas os dados do idioma seleccionado. O texto UTF-8 pode ser armazenado num ficheiro incorporado. O ficheiro incorporado deve começar com //!-- UTF8 e deve ser gravado em formato UTF-8.

A notação de caracteres UTF-8 também pode ser especificada em ambiente Flash's ActionScript. U+0065 seria escrito utilizando a sequência escape \u0065 do código ActionScript.

Outra configuração digna de nota é a definição da codificação para o Flash Player do utilizador final. Esta está pré-definida para falsa (system.useCodepage = false;), a qual irá utilizar UTF-8. Há momentos em que isto pode ter sido alterado para algum objectivo especial, mas deve ser novamente alterado para "falso" antes de exibir novamente o texto UTF-8 colocando o ActionScript apropriado na linha de tempo antes de chamar qualquer texto novo.

Macromedia HomeSite+

Necessita de introduzir a marcação de codificação no ficheiro. Quando gravar o ficheiro seleccione: File > Save As e seleccione a codificação adequada utilizando o menu Encoding dropdown menu.

Também existe um recurso de Protecção HTML que valida o seu código à medida que o digita. Quado utilizar este recurso, certifique-se de o configurar para o mesmo formato da codificação. Vá para: Options > Settings > CodeSweeper category > HTML Tidy CodeSweeper subcategory > Macromedia HTML subcategory > Char encoding dropdown menu.

Microsoft Frontpage 2000-2003 (Windows)

As opções de codificação estão em Language (character set). Vá para: Tools > Page Options > Default Font tab (or Unicode (UTF-8) tab). Irá ver uma opção que diz “Multilingual (UTF-8).”

Microsoft Notepad 2000/XP (Windows)

O Notepad no Win2k/XP oferece quatro opções, 'ANSI' (o codepage correspondente ao local do sistema padrão), 'Unicode' (que significa UTF-16LE em ix86), 'Unicode Big endian', e UTF-8.

Irá necessitar de especificar a codificação de caracteres e o idioma quando escrever o código da marcação. Quando gravar o documento, seleccione File > Save as e seleccione a codificação adequada no menu suspenso Encoding.

Tenha em consideração que o Notepad adiciona uma Assinatura (marca de ordem de byte) ao início do ficheiro antes de o gravar como UTF-8.Isto pode levar a problemas quando visualizar a página em navegadores antigos.

Microsoft WordPad 2000/XP (Windows)

Irá necessitar de especificar a codificação de caracteres e o idioma quando escrever o código da marcação. Quando gravar o documento, seleccione File > Save as e seleccione a codificação adequada no menu suspenso Save as type.

Repare que o WordPad não lhe permite gravar como UTF-8, apenas como UTF-16 LE.

Mozilla/Netscape Composer (Windows, Mac OS, Unix/Linux, OS/2, VMS, BeOS)

A codificação de caracteres para um documento pode ser configurada aqui: View > Character Coding menu. Um ficheiro pode ser gravado utilizando uma codificação de caracteres aqui: File > Save As Charset.

Vim (Windows, Mac OS, Unix/Linux, Amiga, MS-DOS, OS/2 etc.)

A codificação pode ser configurada no modo de comando com o comando :set encoding=utf-8. “utf-8” pode ser substituído por qualquer codificação de caracteres suportada.

W3C Amaya (Mac, Unix, Windows)

Quando gravar o ficheiro vá para File > Save as. Amaya irá certificar-se de que a codoficação está correcta na declaração XML (para XHTML) e a frase meta. Amaya também utiliza a codificação adequada (charset) nos cabeçalhos HTTP quando grava remotamente um documento utilizando PUT. Amaya também compreende várias outras codificações quando carrega um documento, mas não é capaz de gravar em nenhum destes.

XyEnterprise XML Professional Publisher (XPP)

XPP pode receber ficheiros Unicode. As opções de codificação de caracteres existem nos controlos de pré e pós processamento. É geralmente realizada uma codificação específica de caracteres para a saída de XHTML/HTML por XyChange ou pelo kit de ferramentas de HTML.

A propósito

Outro elemento chave na marcação é o indicador da línguagem. Muitas das aplicações listadas aqui combinam a codificação e a linguagem nas opções seleccionáveis pelo utilizador. Se a linguagem não estiver incluída pela aplicação, éboa prática também a incluir manualmente na marcação. Além disso, algumas aplicações podem adquirir as configurações regionais do seu sistema operativo para criar uma etiqueta locale.

Tenha em consideração que o utilizador final pode seleccionar tanto a codificação a utilizar, como a fonte a ser utilizada para cada codificação. Outra opção que é seleccionável pelo utilizador é a opção de "Always send URLs as UTF-8 (Enviar URLs sempre como UTF-8.” No Microsoft Internet Explorer, por exemplo, isto pode ser encontrado aqui: Tools > Internet Options > Advanced tab > Browsing category. Se o seu site necessitar de opções que possam não ser padrão, pode ser pró-activo incluir requisitos de visualização para um site, que direcciona o utilizador para as configurações de codificação e fonte para visualizar correctamente o site da forma pretendida.

Quando o conteúdo está pronto para ser publicado, é sempre boa prática validar o seu conteúdo utilizando a ferramenta de validação W3.

Dê-nos a sua opinião (em inglês).

Subscreva uma alimentação RSS.

Novos recursos

Notícias na página principal

Twitter (Notícias na página principal)

‎@webi18n

Leitura complementar

Autor: Phil Arko, Siemens. Modified by: Richard Ishida, W3C. Tradutor: Portuguese Translation Team, Trusted Translations, Inc..

XHTML 1.0 válida!
CSS válido!
Codificado em UTF-8!

Traduzido de conteúdo em inglês datado de 2005-10-12. Última versão traduzida modificada 2011-05-03 18:00 GMT

Para obter o histórico de alterações do documento, procure qa-setting-encoding-in-applications no blog da i18n.