- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
计算机中的数据表示 什么是数据 信息和信息处理 媒体及其分类 信息的数字化编码 数值编码方法——计数进制 R数制转换为十进制(1/2) 例1 将(11011.11)2转换为十进制数 解:(11011.11) 2 =1×24+1×23+0×22+1×21+1×20+1×2-1+1×2-2 =(27.75)10 R数制转换为十进制(2/2) 例3 将(A5C.B2)16转换为十进制数 解: (A5C.B2)16 =10×162+5×161+12×160+11×16-1+2×16-2 =(2652.6953125)10 十进制转换为R进制数 二进制与八进制、十六进制的转换 定点数——小数点位置固定的数 浮点数——小数点位置不固定的数 整数的原码表示 整数的原码表示范围 整数的原码表示的优缺点 反码—原码和补码的桥梁 整数的补码表示 整数0的补码表示唯一 C++中的整数是用补码表示的 补码加减法规则 补码加减法举例(1/2) 补码加减法举例(2/2) 浮点数IEEE表示 若干特殊浮点数的表示 特殊浮点数的产生 特殊float表示中的约定 字符编码——ASCII码(1/3) 字符编码——ASCII码(2/3) 字符编码——ASCII码(3/3) 汉字编码——按用途有多种编码 GB2312-80的区位码 GB2312中01区、02区的字符 GB2312中16区、17区的字符 GB2312-80中的机内码 字符编码的发展 统一字符集的码位结构 Unicode编码——广为使用的编码 UTF编码——Unicode传输编码 UTF-8——WEB中应用最多的传输编码 UTF-16和UTF-32 Windows对Unicode的支持 数据校验码的作用 数据校验之奇偶校验码 更多的数据校验码 区位码:GB2312-80将汉字和符号分成94区94位,每个字符用两个字节编码,高字节为区号、低字节为位号。 … … 鼾 鳍 鳌 87 86~94 剥 褒 埃 阿 啊 16 〓 ↓ . 。 、 01 94 93 … 03 02 01 区/位 例:“。”—0102,“啊”—1601,“鳌”—8701 例:0179 —— ★, Ⅲ —— 0283 例:啊 —— 1601, 笔 —— 1742 机内码 二字节编码,其值为区位码两字节的编码各加上160,即 机内码 =(区位码)H + A0A0H 编码的范围 在此编码规范下,编码的范围为[A1A1,FEFE],共有8836个码位,除收录的汉字和各种符号外,还有1000多个码位用于扩展。 输入码 现存输入码极多。输入汉字除输入码外,还有字形识别、语音识别。 字形码 用于构造汉字字形,有两种基本的表示方式:点阵字形、矢量字形,现在广泛使用矢量字体。不同的汉字字体和大小对应于不同的字形码! 企业联盟研发,初期与ISO独立,后期融合。 1994年 Unicode 2000年 1995年 1993年 1980年 首发 全球所有文字统一编码。 ISO 10646 兼容早期编码,强制中文系统必须支持。共计27533个字符。 GB18030 国标扩展字符编码,与ISO 10464兼容。共计21885个字符。 GBK 首次汉字编码。 GB2312-80 备注 编码标准 1、不断发展,新版标准持续发布,字符集越来越大; 2、保持向下兼容、横向兼容; 3、越来越方便国际化,但也有兼容性问题; 统一字符集UCS(Universal Character Set)是ISO制定的ISO 10646标准所定义的标准字符集。 UCS用4个字节编码一个字符,最高字节为group编号,共256个。次高字节为平面编号,每组256个。每个平面包含256×256个码位。 这一编码方案并不实用,因为历史以来存在着多种编码体系,与其保持兼容是必须的。 Unicode是Universal Code的缩写。 Unicode计划使用了17个平面,一共有17*65536=1114112个码位。在Unicode 5.0.0版本中,已定义的码位只有238605个,分布在平面0、平面1、平面2、平面14、平面15、平面16。其中平面15和平面16上只是定义了两个各占65534个码位的专用区(Private Use Area),分别是0xF0000-0xFFFFD和0x100000-0x10FFFD。所谓专用区,就是保留给大家放自定义字符的区域,可以简写为PUA。 UCS-2:用2字节编码一个字符,范围为U+0000~U+FFFF。 可编码65536个字符。UCS-2对应前述码位空间中的0组0号平面plane0,称为基本多文种平面BMP(Basic Multili
文档评论(0)