【转】IE不能主动识别UTF-8编码,导致空白页面的问题

本文转自逐浪者

将Joomla!修改为UTF-8编码之后,发现使用部分模版(如Joomla! 1.03附带的rhuk_solarflare_ii模版)时偶尔会发生打开页面为空白的现象,特别是浏览器未设置为“自动选择”编码的时候。

在windows操作系统上使用IE作为浏览器时。常常会发生这样的问题:在浏览使用UTF-8编码的网页时,浏览器无法自动侦测(即没有设定“自动选择”编码格式时)该页面所用的编码。即使网页已经声明过编码格式:

<meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />

由此造成某些含有中文UTF-8编码的页面产生空白输出。

如果使用的是Mozilla、Mozilla Firefox、Sarafi的浏览器这不会造成这个问题。这是由于IE解析网页编码时以HTML内的标签优先,而后才是HTTP header内的讯息;而mozilla系列的浏览器则刚刚相反。

由于UTF-8为3个字节表示一个汉字,而普通的GB2312或BIG5是两个。页面输出时,由于上述原因,使浏览器解析、输出<title> </title>的内容时,如果在</title>前有奇数个全角字符时,IE把UTF-8当作两个字节解析时出现半个汉字的情况,这时该半个汉字会和</title>的<结合成一个乱码字,导致IE无法读完<title>部分,使整个页面为空百输出。而这个时候如果察看源文件的话,会发现实际上整个页面全部已经输出了。

因此最简单的解决办法是在网页文件的标签中一定要把字符定义<meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />放在<title></title>之前。

ps:涉及到编码问题的方式

  1. 服务器httpd.conf文件:AddDefaultCharset UTF-8

    这种方法不推荐,因为服务器上很可能有其他编码的网站存在,所以可以使用AddDefaultCharset off来关闭默认文件编码,服务器依靠html文件投中设置的语言来决定编码。

  2. 脚本php.ini文件:default_charset = "UTF-8"
    作用同httpd.conf文件,也不推荐,可以把该行注释掉,原因同上

  3. .htaccess文档:AddDefaultCharset UTF-8

    一般人都无法修改httpd.cnf和php.ini,同时也不推荐修改这两个文件。这时也可以在网站根目录下写入.htaccess文档,在该文档中设定网站字符集

  4. 网页文件字符集:
    <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />