- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
python字符编码
⼀、 ASCII 码
标准 ASCII 码使用 7 位⼆进制数表示⼤写或小写字
母,数字 0 到 9 标点符号以及在美式英语中使用的特殊
控制字符。
在标准 ASCII 码中,最⾼位(b7)用作奇偶校验位,
所谓奇偶校验 ,是指在代码传送过程中用来检验是否出
现错误的⼀种⽅法,⼀般分奇校验和偶校验两种。奇校
验规定:正确的代码⼀个字节中 1 的个数不许是奇数,
若非奇数,则在最⾼位 b7 添 1 ;偶校验规定:正确的
代码⼀个字节中 1 的个数必须是偶数,若非偶数,则在
最⾼ b7 添 1.
后 128 个称为扩展 ASCII 码。许多基于 x86 的系统
都支持使用扩展(或“ ⾼”)ASCII 。扩展 ASCII 码允许将
每个字符的第 8 位用于确定附加的 128 个特殊字符、外
来语字符和图形符号。
常见的 ASCII 码⼤小:
换⾏ LF 位 0x0A
回车 CR 位 0x0D
空格 0x20
0 0x30
A 0x41
a 0x61
⼆、 扩展 ASCII 码
扩展 ASCII 码是从 128-255 的字符。
三、 Unicode 编码
Unicode 只是⼀个符号集,它规定里符号的⼆进制
代码,却没有规定⼆进制代码如何存储。
所谓的 Unicode 编码指的是 UCS 编码⽅式,即直接
存⼊符号的 Unicode ⼆进制代码。
四、 UTF-8 编码
UTF-8 是互联⽹上使用最⼴泛的⼀种 Unicode 的
实现⽅式。
UTF-8 是⼀种变长的编码⽅式,它使用 1-4 个字节
表示⼀个符号,根据不同的符号选择不同长度的字节表
示。
UTF-8 的编码规则:
1) 对于单⼦节的符号,⼦节的第⼀位设为 0 ,
后面 7 位为这个符号的 unicode 码。因此
对于英语字母,UTF-8 编码和 ASCII 码是
相同的。
2) 对于 n ⼦节的符号(n1),第⼀个⼦节的
前 n 位都设为 1 ,第 n+1 位设为 0 ,后面
⼦节的前两位⼀律设为 10.剩下没有提及
的⼆进制位,全部为这个符号的 unicode
码。
Unicode 符号范围(16 进制) UTF-8 编码⽅式(2 进制)
0000 0000-0000 007F 0xxxxxxx
0000 0080-0000 07FF 110xxxxx 10xxxxxx
0000 0080-0000 FFFF 1110xxxx 10xxxxxx 10xxxxxx
11110xxx 10xxxxxx 10xxxxxx
0001 0000-00
您可能关注的文档
最近下载
- 民用无人机驾驶员训练手册(供参考).doc VIP
- 今日头条机构入驻协议3篇.docx
- 肺部结节影的影像学诊断与鉴别诊断.ppt
- 2025年山东省青岛西海岸新区中考一模训练语文试题(含答案) .pdf VIP
- 民用无人机驾驶员训练手册(2020).docx VIP
- 人教PEP版(2024)三年级下册英语Unit 6 Numbers in life单元整体教学设计(共6课时).docx
- 国网电动汽车服务有限公司招聘笔试题库2022.pdf
- 自娱自乐攻略适用21.0211新春版 by龙行天下Iray.xlsx VIP
- 基于单片机的智能衣柜控制系统设计.docx
- 搅拌站沙石供应合同模板.docx VIP
文档评论(0)