修改 HTML 页面编码为 UTF-8

目标读者: 想要修改他们的 HTML 页面编码的国际化新手。

问题

我该如何把我的 HTML 页面的编码修改为 UTF-8?

你听说,页面编码使用 UTF-8 要比传统编码如 Windows 1252 或 ISO 8859-1 等要来得有用,另外,你还听说其他人正在这么干,但你不确定怎么做。本页面将帮助你。

简约回复

这篇文章总结了你需要的资料。如果你想具体了解某个步骤,请点击嵌入的链接,访问站点上的其它文章。

步骤 1:使用 UTF-8 保存数据

只在你的页面中修改编码声明为 UTF-8 是不够的。你需要确保你的数据是真的用 UTF-8 编码的,或说保存的。如果你正在处理手动编辑过的文件,那么你应该用你的编辑器将文件保存为 UTF-8 而不是你当前使用的编码。如果你正从脚本及数据库中构建文件,请确保数据按需要转换,并且你的脚本环境中设置了正确的参数。

请注意你可能还要保证数据不要包含 UTF-8 签名,即通常所说的字节顺序标记(BOM)。

步骤 2:在页面中声明编码

你必须在你的页面中修改字符编码声明(如果没有的话则添加一个)。

步骤 3:确保你的服务器做对了

虽说你的数据是保存为 UTF-8 了,而且你也在页面中声明过了,但你的服务器还是有可能提供一个随带的 HTTP 头说它是其它编码格式。HTTP 头中的声明会覆盖页面内的信息。

为解决这个问题,你需要检查这究竟算不算一个问题,如果算,采取措施纠正它

哪怕你是通过 ISP 提供的文件,你应该也能自己修改 HTTP 头中发送的编码,但是你需要服务器管理员权限。咨询你的服务器管理员。看 Apache 服务器修改 HTTP 头的一个方法上的解释。