网页乱码引发思考.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
网页乱码引发思考

网页乱码引发思考   网页设计与制作是北京市现行信息技术教材信息技术基础中的重要内容。教师在备课时通过研读教材可以发现,网页是加工和表达信息的一种强大载体,基本网页制作技术也是高中生应会的基本技能。   教材第四单元第三节指出,网页是使用HTML语言编写的纯文本文件。浏览器根据文件中所写的标签来进行显示并赋予不同文本不同的样式。所以理论上,所有文本编辑软件皆可用来编写网页。例如,Windows记事本、Sublime Text、GNU Nano都可以胜任网页编辑工作。在教学实践中,常有学生使用Windows系统自带的记事本软件编写和修改.html文件,此时就可能会有学生遇到“记事本”编写的中文页面在浏览器中乱码的问题,具体情况我们可以用一组实验来说明。   实验过程   我们使用微软Windows7 64位简体中文操作系统和internet explorer 11进行测试。测试步骤如下。   1.打开记事本软件,输入.html文档中必要的html、head、body标签。并在body标签下输入文本“This is a test.这是一个测试”。写法上页如上页图1所示。   2.将文件按默认配置保存为index.html。   3.打开internet explorer,将index.html拖拽到浏览器窗口中。发现英文字符显示正常,但中文显示为乱码(如图2)。   4.查阅网上资料后,可得知通过调节浏览器“编码”选项可以解决这一问题。我们在浏览器窗口内点击鼠标右键,在“编码”一项中勾选“自动选择”(如图3)。此后发现中文字符显示正常。   5.取消自动选择选项,尝试手动选择编码方式为“简体中文(GB2312)”或“Unicode(UTF-8)”。发现选择“简体中文(GB2312)”时中文字符正常显示;选择“Unicode(UTF-8)”时中文字符乱码。   6.确定了中文显示问题是由编码方式引起的,那么回到记事本软件并打开index.html,重新检查保存文件时的选项,发现也有“编码”一项。其默认值为“ANSI”。我们将其调节为浏览器编码选项中出现过的“UTF-8”并重新使用浏览器打开index.html后发现中文字符正常显示。   7.保持index.html的编码方式为UTF-8不变,使用浏览器打开并设置浏览器编码方式为“简体中文(GB2312)”,发现中文显示乱码。   8.继续对其他语种文字进行验证。我们先加上一行日语(如图4)。分别以ANSI、Unicode、UTF-8来保存文件,并使用浏览器以GB2312、Unicode和日语(EUC)来浏览这个文件。结果如表1所示。   9.再增加一行法语字符,这里面特别注意要包含法语中特有的字母“”,重复第八步的实验。从中我们发现保存为ANSI编码文件的时候系统提示无法保存该文件(如下页图5)。所以只存为Unicode和UTF-8两种格式。结果如下页表2。   由上面的实验我们可以得知,当保存文件所选的编码和浏览器设置的编码器一致时,各种字符皆显示正常。不一致时,部分字符会出现乱码。为了避免用户频繁切换编码方式,浏览器开发者均设置了“自动选择”选项来帮助用户自动切换编码方式。但实验中还引发了三个问题:①为什么保存文件和浏览文件时必须选择一致的编码方式才能保证文件的正常显示?②实验证实ANSI和GB2312应属同一种编码方式,但为何名称不同?二者又有什么关系?③在浏览器设置中Unicode被写作“Unicode(UTF-8)”,但记事本软件的保存选项却将“Unicode”和“UTF-8”列为不同的选项,这两者又是什么关系?   下面我们就来针对这三个问题逐一讨论。   文字在计算机内的表达   我们知道计算机内部存储信息是靠“0”和“1”这两个二进制数实现的。如果想表达其他的文字和符号,就要想一个办法用“0”和“1”来进行指代。最早的ASCII码就是使用八位(1字节)二进制数来指代数字、小写英语字母、大写英语字母和常用符号的规则。其中首位统一规定为0,此后的7位来表示不同的符号。表3为a、b、c三个小写英文字母与其二进制编码的对应关系。   这种把字符转换为二进制数在计算机内存储的做法即为“编码”。ASCII仅能满足英语语言中文字的表达,应用范围十分有限。为了方便世界各国文字和符号都能利用计算机进行存储和传输,国际标准化组织和各国的标准化结构都编制了各种文字编码方式,我们在实验中看到的GB2312、Unicode都是常用的编码方式。每种编码方式都自成一体地规定了文字和二进制数之间的对应关系。多数情况下,不同编码方式的“文字―二进制数”对应关系是不同的。我们在记事本软件中保存文件就是把文字转换为二进制数的过程,用浏览器浏览文件就是把二进制数翻译为

文档评论(0)

189****7685 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档