gbkutf8如何选择正确理解和使用GBK及UTF.pdf

  1. 1、本文档共1页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
网页编码英文译为 web page encoding ,是在网页中指定其特定的字符编码格式的库, 本 文将讲述 GBK 及 UTF-8 网页编码定义与应用 网页编码英文译为 web page encoding ,是在网页中指定其特定的字符编码格式的库。 GBK 是国家标准 GB2312 基础上扩容后兼容 GB2312 的标准。 GBK 的文字编码是用双 字节来表示的, 即不论中、英文字符均使用双字节来表示,为了区分中文, 将其最高位都设 定成 1。GBK 包含全部中文字符,是国家编码,通用性比 UTF8 差,不过 UTF8 占用的数据 库比 GBK 大。 UTF-8 :Unicode TransformationFormat-8bit ,允许含 BOM ,但通常不含 BOM 。是用以 解决国际上字符的一种多字节编码, 它对英文使用 8 位(即一个字节) ,中文使用 24 为 (三 个字节)来编码。 UTF-8 包含全世界所有国家需要用到的字符,是国际编码,通用性强。 UTF-8 编码的文字可以在各国支持 UTF8 字符集的浏览器上显示。如果是 UTF8 编码,则在 外国人的英文 IE 上也能显示中文,他们无需下载 IE 的中文语言支持包。 UTF-8 版本虽然具有良好的国际兼容性,但中文需要比 GBK/BIG5 版本多占用 50% 的 数据库存储空间, 因此并非推荐使用, 仅供对国际兼容性有特殊要求的用户使用。 简单地说: 对于中文较多的网站,适宜用 GBK 编码节省数据库空间。对于英文较多的网站,适宜用 UTF-8 节省数据库空间。 GBK 、GB2312 等与 UTF8 如何转换? GBK 、GB2312 等与 UTF8 之间都必须通过 Unicode 编码才能相互转换: GBK 、GB2312 —— Unicode—— UTF8 ;UTF8 —— Unicode—— GBK 、 GB2312 。使用 Windows 记事本的“另存为” ,可以在 GBK 、Unicode 、Unicode big endian 和 UTF-8 这几种编码方式间相互转换。 如 何 让 浏 览 器 正 确 识 别 网 页 编 码 ? 一 般 在 网 页 中 都 要 有 如 下 一 句 : <meta http-equiv="Content-Type" content="text/html; charset=gb2312"> ,指示此网页的字符集编码 是 GB2312 。(或者 UTF-8 ) 页面有时候指定了编码为什么有时会出现乱码?这可能是页面申明编码与文件本身编 码不一致,更多时候是以错误编码打开页面然后保存导致的,或者是用某些 FTP 软件直接 在线修改文件,比如 CuteFTP ,由于软件编码配置错误而导致转换错了编码。这时候使用 window 的记事本打开,用“另存为”保存为对应的编码即可解决问题。 在 windows 操作系统上使用 IE 作为浏览器时,常常会发生这样的问题:在浏览使用 UTF-8 编码的网页时, 浏览器无法自动识别该页面所用的编码, 即使网页已经声明过编码格 式:<meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /> ,由此造成某 些含有中文 UTF-8 编码的页面产生空白输出。如果使用的是 Firefox 、 Sarafi 的浏览器这不 会造成这个问题。这是由于 IE 解析网页编码时以 HTML 内的标签优先,而后才是 HTTP header 内

文档评论(0)

lyf66300 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8020140062000006

1亿VIP精品文档

相关文档