- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
字符集字符编码
ASCII GBXXXX UNICODE
2014/1/7
东北大学
7110312
1 字符集与字符编码
1.1 基础知识
计算机中储存的信息都是用二进制数表示的;而我们在屏幕上看到的英文、汉字等字符是二进制数转换之后的结果。通俗的说,按照何种规则将字符存储在计算机中,如a用什么表示,称为“编码”;反之,将存储在计算机中的二进制数解析显示出来,称为“解码”,如同密码学中的加密和解密。在解码过程中,如果使用了错误的解码规则,则导致a解析成b或者乱码。
字符集(Charset):是一个系统支持的所有抽象字符的集合。字符是各种文字和符号的总称,包括各国家文字、标点符号、图形符号、数字等。
字符编码(Character Encoding):是一套法则,使用该法则能够对自然语言的字符的一个集合(如字母表或音节表),与其他东西的一个集合(如号码或电脉冲)进行配对。
即在符号集合与数字系统之间建立对应关系,它是信息处理的一项基本技术。
通常人们用符号集合(一般情况下就是文字)来表达信息。而以计算机为基础的信息处理系统则是利用元件(硬件)不同状态的组合来存储和处理信息的。
元件不同状态的组合能代表数字系统的数字,因此字符编码就是将符号转换为计算机可以接受的数字系统的数,称为数字代码。
1.2 常用字符集和字符编码
常见字符集名称:ASCII字符集、GB2312字符集、BIG5字符集、GB18030字符集、Unicode字符集等。
计算机要准确的处理各种字符集文字,需要进行字符编码,以便计算机能够识别和存储各种文字。
1.2.1 ASCII字符集编码
ASCII(American Standard Code for Information Interchange,美国信息交换标准代码)是基于 HYPERLINK /wiki/%E6%8B%89%E4%B8%81%E5%AD%97%E6%AF%8D 拉丁字母的一套 HYPERLINK /wiki/%E7%94%B5%E8%84%91 \o 电脑 电脑 HYPERLINK /wiki/%E7%BC%96%E7%A0%81 编码系统。
它主要用于显示 HYPERLINK /wiki/%E7%8F%BE%E4%BB%A3%E8%8B%B1%E8%AA%9E \o 现代英语 现代英语,而其扩展版本EASCII则可以勉强显示其他 HYPERLINK /wiki/%E8%A5%BF%E6%AC%A7 西欧 HYPERLINK /wiki/%E8%AF%AD%E8%A8%80 语言。
它是现今最通用的单 HYPERLINK /wiki/%E5%AD%97%E8%8A%82 字节编码系统(但是有被Unicode追上的迹象),并等同于国际标准ISO/IEC 646。
ASCII字符集:主要包括控制字符(回车键、退格、换行键等);可显示字符(英文大小写字符、阿拉伯数字和西文符号)。
ASCII编码:将ASCII字符集转换为计算机可以接受的数字系统的数的规则。使用7位(bits)表示一个字符,共128字符;但是7位编码的字符集只能支持128个字符,为了表示更多的 HYPERLINK /view/3622.htm \t _blank 欧洲常用字符对ASCII进行了扩展,ASCII扩展字符集使用8位(bits)表示一个字符,共256字符。
ASCII的最大缺点是只能显示26个基本拉丁字母、阿拉伯数目字和英式标点符号,因此只能用于显示现代美国英语(而且在处理英语当中的外来词如na?ve、café、élite等等时,所有重音符号都不得不去掉,即使这样做会违反拼写规则)。而EASCII虽然解决了部份西欧语言的显示问题,但对更多其他语言依然无能为力。因此现在的苹果电脑已经抛弃ASCII而转用 HYPERLINK /wiki/Unicode Unicode。
1.2.2 GBXXXX字符集编码
计算机发明之初及后面很长一段时间,只用应用于美国及西方一些发达国家,ASCII能够很好满足用户的需求。
但是当天朝也有了计算机之后,为了显示中文,必须设计一套编码规则用于将汉字转换为计算机可以接受的数字系统的数。
天朝专家把那些127号之后的奇异符号们(即EASCII)取消掉,规定:一个小于127的字符的意义与原来相同,但两个大于127的字符连在一起时,就表示一个汉字,前面的一个字节(他称之为高字节)从0xA1用到 0xF7,后面一个字节(低字节)从0xA1到0xFE,这样我们就可以组合出大约7000多个简体汉字了。
在这些编码里,还把数学符号、罗马希腊的 字母、日文的假名们都编进去了,连在ASCII里本来就有的数字、标点、字母都统统重新编了两个字节长的编码,这就是常说的“全角”字符,而原来在127号
您可能关注的文档
最近下载
- GB50003-2011 砌体结构设计规范.doc VIP
- 三年级上册劳动人民版雏菊盆景迎重阳教学设计.docx VIP
- 沪教牛津版英语2024七年级上册全册知识清单(记忆版).pdf
- 2025年电子科技大学附属肿瘤医院·四川省肿瘤医院招聘笔试备考题库及答案解析.docx VIP
- 低空空域风切变灾害预警与飞行安全协同控制体系研究.docx VIP
- 2025至2030中国汽车检测行业发展分析及发展趋势分析与未来投资战略咨询研究报告.docx
- 力士乐样本1-液压泵和马达.pdf VIP
- 儿童,颜色,填涂画.docx VIP
- 第六单元+资本主义制度的初步确立+复习课件+2023--2024学年部编版九年级历史上学期.pptx VIP
- 学堂在线 人工智能原理 章节测试答案.docx VIP
文档评论(0)