浮点数的二进制表示学习笔记.docx

下载文档 降价啦

34
0
约6.3千字
约 12页
2020-12-05 发布于天津
举报
版权申诉
保障服务

浮点数的二进制表示学习笔记.docx

1、本文档共12页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

文章1: 单双精度浮点数的IEEE标准格式目前大多数高级语言（包括 C）都按照IEEE-754标准来规定浮点数的存储格式， IEEE754 规定，单精度浮点数用 4字节存储，双精度浮点数用 8字节存储，分为三个部分：符号位、阶和尾数。阶即指数，尾数即有效小数位数。单精度格式阶占 8位，尾数占24位，符号位 1位，双精度则为11为阶，53位尾数和1位符号位，如下图所示: 单精度浮点数存储格式 s ［指数尾数 31 30 23 2 双精度浮点数存储格式 s ［指数尾数 52 5163 62 52 51 细心的人会发现，单双精度各部分所占字节数量比实际存储格式都了一位，的确是这样，事实是，尾数部分包括了一位隐藏位，允许只存储 23位就可以表示24位尾数，默认的 1位是规格化浮点数的第一位，当规格化一个浮点数时，总是调整它使其值大于等于 1而小于2,亦即个位总是为1。例如1100B，对其规格化的结果为 1.1乘以2的三次方，但个位1 并不存储在23位尾数部分内，这个 1是默认位。阶以移码的形式存储。对于单精度浮点数，偏移量为 127 （ 7FH），而双精度的偏移量为1023（ 3FFH ）。存储浮点数的阶码之前，偏移量要先加到阶码上。前面例子中，阶为 2 的三次方，在单精度浮点数中，移码后的结果为 127+3即130（ 82H），双精度为1026（ 40 2H ）。浮点数有两个例外。数 0.0存储为全零。无限大数的阶码存储为全 1，尾数部分全零。符号位指示正无穷或者负无穷。 F面举几个例子: 单精度浮点数十进制格规化. 符移阶码尾数 -12 -1.1x2 I 3 | 1 1000001 0 10000000000000 0 1.0x2 - 0111110 00000000000000 0.25 2 0 1 0 所有字节在内存中的排列顺序， in tel的cpu按little en dia n顺序，motorola的cpu按big en dian顺序排列。浮点数的二进制表示学习笔记基础知识：十进制转十六进制；十六进制转二进制； IEEE制定的浮点数表示规则；了解：目前C/C++编译器标准都遵照IEEE制定的浮点数表示法来进行 float,double运算。这种结构是一种科学计数法，用符号、指数和尾数来表示，底数定为 2――即把一个浮点数表示为尾数乘以 2的指数次方再添上符号。下面是具体的规格符号位阶码尾数长度 float 1 8 23 32 double 1 11 52 64 以下通过几个例子讲解浮点数如何转换为二进制数例一：已知：double 类型 38414.4。求：其对应的二进制表示。分析：double类型共计64位，折合8字节。由最高到最低位分别是第 63、62、61、 0位：最高位63位是符号位，1表示该数为负，0表示该数为正； 62-52位，一共11位是指数位； 51-0位，一共52位是尾数位。步骤：按照IEEE浮点数表示法，下面先把 38414.4转换为十六进制数。把整数部和小数部分开处理：整数部直接化十六进制：960E。小数的处理： 0.4=0.5*0+0.25*1+0.125*1+0.0625*0+ …… 实际上这永远算不完！这就是著名的浮点数精度问题。所以直到加上前面的整数部分算够53位就行了。隐藏位技术：最高位的1不写入内存（最终保留下来的还是 52位）。如果你够耐心，手工算到 53位那么因该是：38414.4（10）=1001011000001110.01100110011 00110011001100110011001100（2）科学记数法为：1.001011000001110 0110011001100110011001100110011001100 ,右移了 15位，所以指数为15。或者可以如下理解： 1.001011000001110 0110011001100110011001100110011001100 X 2A15 于是来看阶码，按IEEE标准一共11位，可以表示范围是-1024 ~ 1023。因为指数可以为负，为了便于计算，规定都先加上 1023（2人10-1），在这里，阶码：15+1023=1038。二进制表示为：100 符号位：因为 38414.4为正对应为0; 合在一起（注：尾数二进制最高位的 1不要）：11100010110 011001100110011001100 例二: 已知：整数 3490593（16进制表示为 0x354321）。求：其对应的浮点数