快捷键及跳转页面导航。跳转到正文开始。

本文档译自其它语种。如有任何偏差或错误的话,请以最新英文原文为准。如下所示,原文版权属于 W3C。.

翻译: Sun Yuanfu

s_gotoW3cHome 国际化
 

介绍字符集与编码

目标读者: 初涉国际化且在选题和如何着手使用网站素材方面需要指导的人员。

对于那些对网络国际化不知从何入手的新手﹐本网页提供了基本指导﹐期望助其轻松地逐渐了解﹑认识和使用网上资料。

网页右边有精选文章链接,点击即可阅读有关详细内容。 一旦你从本网页得到启发,则只需使用 主题索引技术索引, 或网站搜索就可以查阅相关内容。

什么是字符集?编码有何用途?

了解更多...

字符编码入门 解释了字符编码的某些基本概念,以及为什么你应注意字符编码。

字符编码相关基本定义 解释了Unicode﹑ 字符集﹑编码字符集﹑字符编码﹑文档字符集﹑字符转义等术语。

字符集是书写系统字母与符号的集合。例如,ASCII 字符集包括英语字母、符号;ISO-8859-6字符集包括许多基于阿拉伯语言文字的字母、符号;Unicode 字符集涵盖世界上多数活语言文字字符。

字符集里的字符在计算机中存储为一个或多个字节,每一个或每一序列字节代表一特定字符。字符编码关键在将一特定字节或序列字节编码对应 ( 映射 )以文本字体显示的特定字符。

现有许多不同类型的字符编码。 如果错用了与存储字节不一致的编码, 结果就是乱码。所以,如要文字内容可以阅读,则要正确标注字符编码,这很重要。

编码的选择

每个开发人员,无论是内容创作或编程,都必须事先决定使用哪一种字符编码。现时,大多推荐用UTF-8,但仍会有其它因素需要考虑,方可定夺。

了解更多...

HTML & CSS 编辑人员
Choosing a character encoding

规范开发人员
Choosing character encodings

服务器设置
Choosing a character encoding


声明和应用编码

一旦决定使用何种编码,内容创作者和程序员必须确保此编码要正确地予以声明。

在象XHTML这一类的技术中,编码声明并非总是直接了当的,这就需要正确理解“标准”模式与“非标”模式 , 也要理解XML声明的作用。

仅予标注还不够,你还须确保数据以选定编码存贮。

内容开发人员和网站管理员也要确保 服务器 能够以正确的字符编码声明传递内容,因为服务器的设置将会覆盖文档中的声明。

转义

转义是一种方法,即只用ASCII文本方式来表示某个字符,可用来表示所用编码中没有的字符,或因其他原因(比如它们可能与句法冲突)需避免使用的字符。你应该清楚何时及如何使用转义。

了解更多...

HTML & CSS 编辑人员
Using escapes to represent characters

SVG 编辑人员
Using escapes to represent characters

XML 编辑人员
Using escapes to represent characters

规范开发人员
Designing character escapes


网址

现时网址也可包括非ASCII字符,用户只需点击相应的链接或输入所见文字,其主要编码任务皆由用户代理完成,但你可能有兴趣了解这是如何实现的。

规范开发人员应制订相应规范以便人们能够正常使用非ASCII的网址。


作者: Richard Ishida, W3C. 翻译: Sun Yuanfu.

正确的 XHTML 1.0!
正确的 CSS!
UTF-8 编码!

翻译以格林尼治标准时间 2009-05-01 的英语内容为准,并于格林尼治标准时间 2012-03-27 10:29 作最新修改。

想了解文档的历次更新情况,请在国际化博客中搜索 gs-characters