计算机基础知识:认识字符编码.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
计算机基础知识:认识字符编码 ⼤家好呀~到昨天为⽌,关于 Learn Python 3 The Hard Way 这本书的中⽂译本《笨办法学Python3》就已经全部完成了,为了⽅便⼤家阅 读,我特意整理制作了 PDF 版,⼤家可以在“学习癌”公众号后台回复“P3中⽂”来获取下载链接。 因为⽤了不同的转换⽅法,⽽且它们各有优劣,所以我把相对⽐较好的两版都放出来了,分别是:“⽬录⽆效代码⾼亮版”和“⽬录有效代码不亮 版”,前者⽂档中⽬录链接⽆效,但是有标签⽬录,并且对代码块有良好的展⽰。后者正⽂中⽬录链接有效,但代码块没有⾼亮格式。整体来说推 荐前者,因为标签⽬录⽐正⽂⽬录更好⽤。不过⼤家可以根据⾃⼰喜好⾃⾏选择。 接下来,我打算先学习⽤ Python 做⽂本处理,⽐如读写修改 word、excel 中的数据等,主要考虑到办公⾃动化是包括我在内的很多上班族的普 遍需求。具体的教材和课程我还没有找好,等找好了正式启动学习,我会跟⼤家说,并且继续跟⼤家分享学习笔记。 今天这篇是⽐较特殊的⼀篇推送,源于⼏天前的⼀件众所周知的传播事件。当时激愤之下写了这篇“教程”,由于不想打乱原本的推送计划,所以 这篇⽂章搁置了⼏天,甚⾄想过⼲脆不发了,但是想想毕竟花了些⼼思,⽽且对⼩⽩来说,也确实能学到点东西,就发出来做个纪念吧。 字符编码 今天我们要深⼊学习⼀个计算机的基础知识——字符编码。 相信⼤家在漫长的⽹上冲浪⽣涯中,⼀定碰到过计算机乱码的情况,⽐如这样的⽕星⽂: 乱码.jpg 也肯定看到过包括简体中⽂、繁体中⽂、英⽂、法⽂、阿拉伯⽂等在内的多种语⾔的⽹站。 那么,你可曾想过,传说中只能读懂 0 和 1 的计算机,为什么能显⽰如此五花⼋门的内容呢? 要回答这个问题,我们要先从⼆进制说起。 ⼆进制 虽然现代计算机起源于西⽅,但中国很早就有了⼆进制的概念。 约公元前三世纪初,《易经》中就⽤“—”和“--”表⽰卦符,这组符号被称作“⽘”。“—”是阳⽘,“--”是阴⽘。 如果把“—”换成 1,把“--”换成 0,⽘就是⼀个只有两个元素的集合,这个集合就是⼀个标准的⼆进制位。 那么,⼀位⼆进制数(可以理解为我们常说的个位数)只能表⽰ 2 个数,也就是 1 和 0。 两位⼆进制数(两位数)能表⽰ 4 个数:11,10,01,00。 三位⼆进制(三位数)就能表⽰ 8 个数:111,110,101,100,011,010,001,000。 ⼤家如果仔细观察《易经》的⼋卦图: ⼋卦图.jpg 就会看到,⼋卦中的每⼀卦都是由三个⽘符组成的。 如果把“—”和“--”分别换为 1 和 0 ,那么⼋卦图按顺时针⽅向就可以看成是: 111 110 010 100 000 001 101 011 这⼋种排列组合。 相信⼩学数学还没忘的同学已经看出规律来了,对于⼆进制数来说,n 位数能表⽰的数的个数就是 2 的 n 次⽅。 在计算机中,⽤来存放⼀位 0 或 1,就是计算机⾥最⼩的存储单位,叫做“位”,也叫“⽐特”(bit)。⽽ 8 个⽐特构成⼀个“字 节”(byte),这是计算机⾥最常⽤的单位。 ⽐特和字节 bit 和 byte 长得有点像,可不能弄混了,1 byte = 8 bit,也就是 1 字节等于 8 ⽐特,通常简写为 1B(byte) = 8bit。 我们最常看到的 KB 是千字节(Kilobyte),MB 是兆字节(Megabyte),GB 是吉字节(Gigabyte),它们之间是按 2 的 10 次⽅(也就是 1024)进⾏换算的,相信⼤家都很熟悉了: 1KB = 1024B 1MB = 1024KB 1GB = 1024MB 再顺便给⼤家科普⼀个⽣活常识,通常我们看到的下载速度都是以字节每秒为单位显⽰的,⽽运营商的宽带业务中所说的百兆宽带,则是以⽐特每 秒为单位的,真实的下载速度要除以 8,最多只有⼗多兆每秒。 扯远了,说回编码。 编码表 ⼆进制虽然只有 0 和 1 两个元素,但是也是可以表⽰其他数字的,只是写起来⽐较长罢了。可是 abcd、#¥% 等等这样的字母和符号计算机 要如何表⽰呢? 为此,⼈们就制定了⼀套规则,把⼈类语⾔和计算机语⾔⼀⼀对应起来,这就叫编码。 所以,编码的本质就是让只认识 0 和 1 的计算机,能够理解⼈类使⽤的语⾔符号,并且将数据转换为⼆进制进⾏存储和传输。 既

文档评论(0)

134****3224 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档