A tecla de acesso 'n' salta para outro local na navegação da página. Saltar para o início do conteúdo.

Este documento é uma tradução. Se ocorrerem discrepâncias ou erros, o original em inglês mais recente terá precedência. Os direitos autorais originais pertencem ao W3C, como indicado no final da página.

Tradutor: Brazilian Portuguese Translation Team, Trusted Translations, Inc.

s_gotoW3cHome Internacionalização
 

Como definir a codificação em aplicativos de criação web

Público alvo: usuários, codificadores de XHTML/HTML (utilizando editores ou linguagem de script), desenvolvedores de conteúdos e qualquer pessoa que necessite de algumas dicas sobre como salvar documentos do editor em uma codificação específica.

Pergunta

Como defino a codificação de caracteres em meus aplicativos de criação web?

Informações

O conteúdo na web pode ser criado utilizando uma variedade de aplicativos de software. Mesmo em um único site, o conteúdo pode ter sido criado utilizando várias ferramentas de autoria. Por exemplo, um site que foi criado utilizando o Macromedia Dreamweaver também pode incluir uma página criada com a utilização do recurso de página de acesso de dados do Microsoft Access, assim como um filme Flash dinâmico que permita a seleção do idioma. Para que todos estes arquivos apresentem o texto correto, eles devem ser codificados adequadamente.

O objetivo deste artigo é identificar onde algumas das principais funcionalidades de codificação existem em alguns dos aplicativos de criação web mais populares.

Resposta

As opções específicas para configurar as codificações de caracteres muitas vezes variam dependendo da versão do usuário, por isso elas não são discutidas detalhadamente para cada aplicativo. Para obter informações mais detalhadas, consulte o conteúdo de ajuda específico do aplicativo ou os manuais do usuário. As palavras-chave comuns de índice e pesquisa incluem Codificação de Caracteres, Internacionalização, Multilíngue, Unicode e UTF.

Existem dois pontos principais que devem ser lembrados ao criar arquivos codificados corretamente:

  1. A marcação dentro do documento deve designar corretamente a codificação (como charset=iso-8859-1 em uma meta tag XHTML/HTML, ou encoding="UTF-8" em uma frase de declaração XML).
  2. O arquivo propriamente dito deve ser salvo no formato de codificação apropriado (como UTF-8).

A seguir, estão alguns pontos a serem considerados ao utilizar esses aplicativos:

Recomendamos a utilização da codificação Unicode porque ela simplifica muito o trabalho de criar sites multilíngues na Internet.

Adobe FrameMaker 7.0

As opções de codificação existem dentro de HTML Options Table.

Adobe Golive 6 e CS (Mac & Win)

Para especificar a codificação de caracteres para novas páginas, clique em: Edit > Preferences > Encodings category. No GoLive CS (Mac), o Menu Preferences (Preferências) está localizado no menu principal Application (Aplicativo) (de acordo com as Especificações da Apple)

Para alterar a codificação da página, clique em File > Document Encoding. No GoLive CS, é possível utilizar também Edit > Document Content > Change Encoding....

Apple TextEdit (Mac OS X 10.2)

Será necessário inserir a marcação de codificação adequada no arquivo HTML/XHTML. Os arquivos são salvos inicialmente como UTF-8.

Helios TextPad (Windows)

Será necessária a introdução da marcação adequada para codificação no arquivo. Ao salvar o documento, o formato adequado do arquivo pode ser selecionado aqui. File > Save As > Encoding dropdown menu.

Macromedia ColdFusion (Windows)

Para configurar adequadamente o aplicativo ColdFusion, familiarize-se com os vários comandos e funções de codificação (alguns dos quais incluem setEncoding, cfcontent, e o atributo do formato enctype).

Macromedia Dreamweaver MX (Mac & Windows)

Para especificar a codificação de caracteres de suas páginas, clique em Modify > Page Properties. Selecione a codificação adequada no Document Encoding dropdown menu.

Também pode ser preciso especificar a codificação de caracteres para visualizar as páginas durante a edição: Clique em Edit > Preferences > Fonts category (Dreamweaver > Preferences > Fonts category no Mac).

Macromedia Flash MX (Mac & Windows)

Quando criados de modo eficaz, os filmes Flash multilíngues muitas vezes armazenam o texto para cada idioma em arquivos separados incorporados (#include), reduzindo o tempo necessário para baixar um filme flash ao enviar apenas os dados do idioma selecionado. O texto UTF-8 pode ser armazenado em um arquivo incorporado. O arquivo incorporado deve começar com //!-- UTF8 e deve ser salvo em formato UTF-8.

A notação de caracteres UTF-8 também pode ser especificada no ambiente de Flash do ActionScript. U+0065 seria escrito utilizando a sequência de escape \u0065 no código ActionScript.

Outra configuração digna de nota é a definição da codificação para o Flash Player do usuário final. Ela está predefinida para falso (system.useCodepage = false;), que utilizará UTF-8. Há momentos em que isto pode ter sido alterado por algum motivo especial, mas deve ser novamente alterado para "falso" antes de exibir o texto UTF-8 de novo, colocando o ActionScript apropriado na linha de tempo antes de abrir qualquer texto novo.

Macromedia HomeSite+

Você precisa inserir a marcação de codificação no arquivo. Ao salvar o arquivo, selecione: File > Save As e selecione a codificação adequada utilizando o Encoding dropdown menu.

Também existe um recurso HTML Tidy, que valida o seu código à medida que você o digita. Quando utilizar este recurso, certifique-se de configurá-lo para o mesmo formato da codificação. Clique em: Options > Settings > CodeSweeper category > HTML Tidy CodeSweeper subcategory > Macromedia HTML subcategory > Char encoding dropdown menu.

Microsoft Frontpage 2000-2003 (Windows)

As opções de codificação estão em Language (character set). Clique em: Tools > Page Options > Default Font tab (ou Unicode (UTF-8) tab). Você verá uma opção que diz “Multilingual (UTF-8).”

Microsoft Notepad 2000/XP (Windows)

O Notepad no Win2k/XP oferece quatro opções: 'ANSI' (o código de página correspondente ao local padrão do sistema), 'Unicode' (que significa UTF-16LE em ix86), 'Unicode Big endian', e UTF-8.

Você precisará especificar a codificação de caracteres e o idioma quando escrever o código da marcação. Para salvar o documento, clique em File > Save as e selecione a codificação adequada no menu suspenso Encoding.

Tenha em mente que o Notepad adiciona uma assinatura (marca de ordem de byte) ao início do arquivo antes de salvar como UTF-8. Isto pode causar problemas ao visualizar a página em navegadores mais antigos.

Microsoft WordPad 2000/XP (Windows)

Você precisará especificar a codificação de caracteres e o idioma quando escrever o código da marcação. Para salvar o documento, clique em File > Save as e selecione a codificação adequada no menu suspenso Save as type.

Observe que o WordPad não permite salvar como UTF-8, apenas como UTF-16 LE.

Mozilla/Netscape Composer (Windows, Mac OS, Unix/Linux, OS/2, VMS, BeOS)

A codificação de caracteres para um documento pode ser configurada aqui: View > Character Coding menu. Um arquivo pode ser salvo utilizando uma codificação de caracteres diferente aqui: File > Save As Charset.

Vim (Windows, Mac OS, Unix/Linux, Amiga, MS-DOS, OS/2 etc.)

A codificação pode ser configurada no modo de comando, com o comando :set encoding=utf-8. “utf-8” pode ser substituído por qualquer codificação de caracteres suportada.

W3C Amaya (Mac, Unix, Windows)

Para salvar o arquivo, clique em File > Save as. O Amaya irá certificar-se de que a codificação está correta na declaração XML (para XHTML) e na meta. O Amaya também utiliza a codificação adequada (charset) nos cabeçalhos HTTP quando salva remotamente um documento utilizando PUT. O Amaya também reconhece várias outras codificações quando carrega um documento, mas não é capaz de salvar em nenhuma delas.

XyEnterprise XML Professional Publisher (XPP)

O XPP pode receber arquivos Unicode. As opções de codificação de caracteres existem nos controles de pré e pós processamento. Codificações específicas de caracteres para a saída de XHTML/HTML geralmente são realizadas com o XyChange ou o HTML Toolkit.

A propósito

Outro elemento-chave na marcação é o indicador do idioma. Muitos dos aplicativos listados aqui combinam a codificação e o idioma nas opções selecionáveis pelo usuário. Se o idioma não for incluído pelo aplicativo, é interessante também incluir isso na marcação manualmente. Além disso, alguns aplicativos podem adquirir as configurações regionais de seu sistema operacional para criar uma tag locale.

Tenha em mente que o usuário final pode selecionar tanto a codificação a utilizar, como a fonte a ser usada para cada codificação. Outra opção que é selecionável pelo usuário é a opção de "Always send URLs as UTF-8 (Enviar URLs sempre como UTF-8”. No Microsoft Internet Explorer, por exemplo, isto pode ser encontrado aqui: Tools > Internet Options > Advanced tab > Browsing category. Se o seu site precisar de opções que não são padrões, pode ser interessante incluir requisitos de visualização para um site, o que direciona o usuário para as configurações de codificação e fonte para visualizar corretamente o site da forma pretendida.

Quando o conteúdo está pronto para ser publicado, é sempre interessante validar o seu conteúdo utilizando a ferramenta de validação W3.

Dê-nos a sua opinião (em inglês).

Subscreva uma alimentação RSS.

Novos recursos

Notícias na página principal

Twitter (Notícias na página principal)

‎@webi18n

Leitura complementar

Autor: Phil Arko, Siemens. Modificado por: Richard Ishida, W3C. Tradutor: Brazilian Portuguese Translation Team, Trusted Translations, Inc..

XHTML 1.0 válida!
CSS válido!
Codificado em UTF-8!

Traduzido de conteúdo em inglês datado de 2005-10-12. Última versão traduzida modificada 2011-05-03 18:00 GMT

Para obter o histórico de alterações do documento, faça uma busca por qa-setting-encoding-in-applications no blog da i18n.