A tecla de acesso 'n' salta para outro local na navegação da página. Saltar para o início do conteúdo.
Este documento é uma tradução. Se ocorrerem discrepâncias ou erros, o original em inglês mais recente terá precedência. Os direitos autorais originais pertencem à W3C, como indicado abaixo.
Tradutor: Portuguese Translation Team, Trusted Translations, Inc.
Público alvo: utilizadores, codificadores de XHTML/HTML (utilizando editores ou escrita), desenvolvedores de conteúdos e alguém que necessite de algumas dicas sobre como gravar documentos do seu editor numa codoficação específica.
Como defino a codificação de caracteres nas minhas aplicação de autorização web?
O conteúdo na web pode ser autorizado utilizando uma variedade de aplicações de software. Mesmo num único site, o conteúdo pode ter sido criado utilizando várias ferramentas de autorização. Por exemplo, um site da web que foi criado utilizando o Macromedia Dreamweaver também pode incluir uma página criada utilizando o recurso de página de acesso de dados do Microsoft Access, assim como um filme Flash dinâmico que permita a selecção do idioma. De modo a que todos estes ficheiros sirvam o texto correcto, necessitam de ser codificados adequadamente.
O objectivo deste artigo é identificar onde é que algumas das principais funcionalidades de codificação existem em algumas das aplicações de autorização web mais populares.
As opções específicas para configurar as codificações de caracteres variam frequentemente dependendo da versão do utilizador, e assim, estas não são discutidas detalhadamente para cada aplicação. Para obter informações mais detalhadas, consulte o conteúdo de ajuda específico da aplicação ou os manuais do utilizador. Os índices comuns e a pesquisa de palavras-chave incluem Codificação de Caracteres, Internacionalização, Multilingua, Unicode e UTF.
Existem dois pontos principais a recordar quando criar ficheiros codificados correctamente:
charset=iso-8859-1 numa meta tag XHTML/HTML, ou encoding="UTF-8" numa frase de declaraçao XML).A seguir estão alguns pontos a ser considerados quando utilziar estas aplicações:
A maioria destas aplicações irá gravar o ficheiro no formato adequado, mas pode não aplicar automaticamente a marcação adequada no documento.
Algumas aplicações inserem automaticamente a marcação BOM, enquanto outras não. A presença da marcação BOM em páginas com codificação UTF-8 pode criar problemas em navegadores antigos.
Enquanto uma aplicação pode estar capacitada para Unicode e ser capaz de gravar um ficheiro no formato adequado e com a codificação adequada, pode não ser capaz de lidar com caracteres posteriores, por exemplo, o conjunto de caracteres Latin-1.
Recomendamos a utilização da codificação Unicode porque simplifica muito o esforço de criar sites da internet multilíngues.
As opções de codificação existem dentro de HTML Options Table.
Para especificar a codificação de caracteres para novas páginas, vá para: Edit > Preferences > Encodings category. No GoLive CS (Mac), o Menu Preferences (Preferências) está localizado no menu principal Application (Aplicação) (de acordo com as Especificações Apple)
Para alterar a codificação da página vá para File > Document Encoding. No GoLive CS pode utilizar também Edit > Document Content > Change Encoding....
Irá necessitar de introduzir a marcação de codificação adequada no ficheiro HTML/XHTML. Os ficheiros são gravados inicialmente como UTF-8.
Será necessária a introdução a marcação adequada no ficheiro da codificação. Quado gravar o documento, o formato adequado do ficheiro pode ser seleccionado aqui. File > Save As > Encoding dropdown menu.
Para configurar adequadamente a aplicação ColdFusion, familiarize-se com os vários comandos e funções de codificação (alguns dos quais incluem setEncoding, cfcontent, e o atributo do formato enctype).
Para especificar a codificação de caracteres das suas páginas, vá para Modify > Page Properties. Seleccione a codificação adequada no menu Document Encoding dropdown menu..
Para também necessitar de especificar a codificação de caracteres para visualizar as páginas durante a edição: Vá para Edit > Preferences > Fonts category (Dreamweaver > Preferences > Fonts category no Mac).
Quando concebidos eficazmente, os filmes Flash multilingues armazenam muitas vezes o texto para cada idioma em ficheiros separados incorporados (#include), reduzindo o tempo necessário para descarregar um filme flash enviando apenas os dados do idioma seleccionado. O texto UTF-8 pode ser armazenado num ficheiro incorporado. O ficheiro incorporado deve começar com //!-- UTF8 e deve ser gravado em formato UTF-8.
A notação de caracteres UTF-8 também pode ser especificada em ambiente Flash's ActionScript. U+0065 seria escrito utilizando a sequência escape \u0065 do código ActionScript.
Outra configuração digna de nota é a definição da codificação para o Flash Player do utilizador final. Esta está pré-definida para falsa (system.useCodepage = false;), a qual irá utilizar UTF-8. Há momentos em que isto pode ter sido alterado para algum objectivo especial, mas deve ser novamente alterado para "falso" antes de exibir novamente o texto UTF-8 colocando o ActionScript apropriado na linha de tempo antes de chamar qualquer texto novo.
Necessita de introduzir a marcação de codificação no ficheiro. Quando gravar o ficheiro seleccione: File > Save As e seleccione a codificação adequada utilizando o menu Encoding dropdown menu.
Também existe um recurso de Protecção HTML que valida o seu código à medida que o digita. Quado utilizar este recurso, certifique-se de o configurar para o mesmo formato da codificação. Vá para: Options > Settings > CodeSweeper category > HTML Tidy CodeSweeper subcategory > Macromedia HTML subcategory > Char encoding dropdown menu.
As opções de codificação estão em Language (character set). Vá para: Tools > Page Options > Default Font tab (or Unicode (UTF-8) tab). Irá ver uma opção que diz “Multilingual (UTF-8).”
O Notepad no Win2k/XP oferece quatro opções, 'ANSI' (o codepage correspondente ao local do sistema padrão), 'Unicode' (que significa UTF-16LE em ix86), 'Unicode Big endian', e UTF-8.
Irá necessitar de especificar a codificação de caracteres e o idioma quando escrever o código da marcação. Quando gravar o documento, seleccione File > Save as e seleccione a codificação adequada no menu suspenso Encoding.
Tenha em consideração que o Notepad adiciona uma Assinatura (marca de ordem de byte) ao início do ficheiro antes de o gravar como UTF-8.Isto pode levar a problemas quando visualizar a página em navegadores antigos.
Irá necessitar de especificar a codificação de caracteres e o idioma quando escrever o código da marcação. Quando gravar o documento, seleccione File > Save as e seleccione a codificação adequada no menu suspenso Save as type.
Repare que o WordPad não lhe permite gravar como UTF-8, apenas como UTF-16 LE.
A codificação de caracteres para um documento pode ser configurada aqui: View > Character Coding menu. Um ficheiro pode ser gravado utilizando uma codificação de caracteres aqui: File > Save As Charset.
A codificação pode ser configurada no modo de comando com o comando :set encoding=utf-8. “utf-8” pode ser substituído por qualquer codificação de caracteres suportada.
Quando gravar o ficheiro vá para File > Save as. Amaya irá certificar-se de que a codoficação está correcta na declaração XML (para XHTML) e a frase meta. Amaya também utiliza a codificação adequada (charset) nos cabeçalhos HTTP quando grava remotamente um documento utilizando PUT. Amaya também compreende várias outras codificações quando carrega um documento, mas não é capaz de gravar em nenhum destes.
XPP pode receber ficheiros Unicode. As opções de codificação de caracteres existem nos controlos de pré e pós processamento. É geralmente realizada uma codificação específica de caracteres para a saída de XHTML/HTML por XyChange ou pelo kit de ferramentas de HTML.
Outro elemento chave na marcação é o indicador da línguagem. Muitas das aplicações listadas aqui combinam a codificação e a linguagem nas opções seleccionáveis pelo utilizador. Se a linguagem não estiver incluída pela aplicação, éboa prática também a incluir manualmente na marcação. Além disso, algumas aplicações podem adquirir as configurações regionais do seu sistema operativo para criar uma etiqueta locale.
Tenha em consideração que o utilizador final pode seleccionar tanto a codificação a utilizar, como a fonte a ser utilizada para cada codificação. Outra opção que é seleccionável pelo utilizador é a opção de "Always send URLs as UTF-8 (Enviar URLs sempre como UTF-8.” No Microsoft Internet Explorer, por exemplo, isto pode ser encontrado aqui: Tools > Internet Options > Advanced tab > Browsing category. Se o seu site necessitar de opções que possam não ser padrão, pode ser pró-activo incluir requisitos de visualização para um site, que direcciona o utilizador para as configurações de codificação e fonte para visualizar correctamente o site da forma pretendida.
Quando o conteúdo está pronto para ser publicado, é sempre boa prática validar o seu conteúdo utilizando a ferramenta de validação W3.
Dê-nos a sua opinião (em inglês).
Subscreva uma alimentação RSS.
Twitter (Notícias na página principal)
Traduzido de conteúdo em inglês datado de 2005-10-12. Última versão traduzida modificada 2011-05-03 18:00 GMT
Para obter o histórico de alterações do documento, procure qa-setting-encoding-in-applications no blog da i18n.
Copyright © 2003-2011 W3C® (MIT, ERCIM, Keio, Beihang), All Rights Reserved. W3C liability, trademark, document use and software licensing rules apply. Your interactions with this site are in accordance with our public and Member privacy statements.