单双精度浮点数IEEE标准格式.doc

下载文档

14
0
约3.45千字
约 2页
2017-08-23 发布于河南
举报
版权申诉
保障服务

单双精度浮点数IEEE标准格式.doc

1、本文档共2页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

单双精度浮点数IEEE标准格式

单双精度浮点数的IEEE标准格式目前大多数高级语言（包括C）都按照IEEE-754标准来规定浮点数的存储格式，IEEE754规定，单精度浮点数用4字节存储，双精度浮点数用8字节存储，分为三个部分：符号位、阶和尾数。阶即指数，尾数即有效小数位数。单精度格式阶占8位，尾数占24位，符号位1位，双精度则为11为阶，53位尾数和1位符号位，如下图所示：单精度浮点数存储格式 ?s 指数? ?尾数 ????????????????? ? ?31??30??? ??? 23?22?? ??? 0 双精度浮点数存储格式 ?s ?指数尾数? ???????????????? ?? 63???62?????? 52? 51?? ??? 0 ??????? 细心的人会发现，单双精度各部分所占字节数量比实际存储格式都了一位，的确是这样，事实是，尾数部分包括了一位隐藏位，允许只存储23位就可以表示24位尾数，默认的1位是规格化浮点数的第一位，当规格化一个浮点数时，总是调整它使其值大于等于1而小于2，亦即个位总是为1。例如1100B，对其规格化的结果为1.1乘以2的三次方，但个位1并不存储在23位尾数部分内，这个1是默认位。 ??????? 阶以移码的形式存储。对于单精度浮点数，偏移量为127（7FH），而双精度的偏移量为1023（3FFH）。存储浮点数的阶码之前，偏移量要先加到阶码上。前面例子中，阶为2的三次方，在单精度浮点数中，移码后的结果为127+3即130（82H），双精度为1026（402H）。 ??????? 浮点数有两个例外。数0.0存储为全零。无限大数的阶码存储为全1，尾数部分全零。符号位指示正无穷或者负无穷。下面举几个例子：单精度浮点数 ?十进制规格化符号移阶码尾数?????????????????? ?-12 -1.1x23? ?11000000 ?0.25 1.0x2-2? ?00000000? ?所有字节在内存中的排列顺序，intel的cpu按little endian顺序，motorola的cpu按big endian顺序排列。 PS: float型变量：根据IEEE的浮点标准，一个浮点数应该用下述形式来表示: V=(-1)^s * M * 2^E （公式1）在C语言中，32位的float型变量有着这样的规定：首位表示符号位s，接下来的8位（指数域）用于表示2的指数E，剩余的23位（小数域）表示M（取值范围为[1，2）或[0，1））。除了上述规定以外，根据指数域的二进制表示情况不同，被编码的float型数字又可以分成三种情况——1、规格化值。当指数域的8个二进制数字既非全零又非全1时，float数值就是这种情况。设指数域的八位二进制所表示的十进制数为e, 则公式1中的E就是 E = e - (2^7 - 1) （公式2）；而且此时，将小数域所表示的二进制假设为(f22)(f21)...(f1)(f0) (注2) ，则该小数域所表示的值即为f = 0.(f22)(f21)...(f1)(f0).于是M = 1 + f2. 非规格化值。当指数域的8个二进制数字为全0时，float数值就为这种情况。这时指数域所表示的十进制数为0，规定指数值为 E = 1 - (2^7 - 1),也就是E为定值-126；此时小数域的值仍表示f = 0.(f22)(f21)...(f1)(f0),但是M的值却变成M = f。3. 特殊值。当指数域的8个二进制数字为全1时即为这种情况。当小数域为全零时，该float值根据符号位的不同表示正无穷或者负无穷；当小数域为非全零时，该float值为NaN（Not a Number）。