浮点数在计算机中存储方式及其遵循IEEE.pdfVIP

浮点数在计算机中存储方式及其遵循IEEE.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

浮数计算机中方式

作者:jillzhang

:jillzhang@126.com

本文为,请保留出处以及作者,谢谢

C语言和C#语言中,对于浮点类型的数据采用单精度类型(float)和双精度类型(double)来,

float数据占用32bit,double数据占用64bit,我们在一个变量floatf=2.25f的时候,是如何分配内

存的呢?如果胡乱分配,那世界岂不是乱套了么,其实不论是float还是double在方式上都是遵从

IEEE的规范的,float遵从的是IEEER32.24,而double遵从的是R64.53。

无论是单精度还是双精度在中都分为三个部分:

符号位(Sign):0代表正,1代表为负

指数位(Exponent):用于科学中的指数数据,并且采用移位

尾数部分(Mantissa):尾数部分

其中float的方式如下图所示:

而双精度的方式为:

R32.24和R64.53的方式都是用科学来数据的,比如8.25用十进制的科学表

示就为:8.25*,而120.5可以表示为:1.205*,这些小学的知识就不用多说了吧。而我们傻蛋计算

机根本不认识十进制的数据,他只认识0,1,所以在计算机中,首先要将上面的数更改为二进制的科

学表示,8.25用二进制表示可表示为1000.01,,不会连这都不会转换吧?那我估计要没辙了。

120.5用二进制表示为:1110110.1用二进制的科学表示1000.01可以表示为

1.0001*,1110110.1可以表示为1.1101101*,任何一个数都的科学表示都为1.xxx*,尾

数部分就可以表示为xxxx,第一位都是1嘛,干嘛还要表示呀?可以将小数点前面的1省略,所以23bit的

尾数部分,可以表示的精度却变成了24bit,道理就是在这里,那24bit能精确到小数点后几位呢,我们知

道9的二进制表示为1001,所以4bit能精确十进制中的1位小数点,24bit就能使float能精确到小数点后

6位,而对于指数部分,因为指数可正可负,8位的指数位能表示的指数范围就应该为:-127-128了,所以

指数部分的采用移位,的数据为元数据+127,下面就看看8.25和120.5在内存中真正的存

储方式。

首先看下8.25,用二进制的科学表示为:1.0001*

按照上面的方式,符号位为:0,表示为正,指数位为:3+127=130,位数部分为,故8.25的方式

如下图所示:

而单精度浮点数120.5的方式如下图所示:

那么如果给出内存中一段数据,并且告诉你是单精度的话,你如何知道该数据的十进制数值呢?其实

就是对上面的反推过程,比如给出如下内存数据:0000000000,首先我们现

将该数据分段,010000010111011010000000000000000,在内存中的就为下图所示:

根据我们的计算方式,可以计算出,这样一组数据表示为:1.1101101*=120.5

而双精度浮点数的和单精度的大同小异,不同的是指数部分和尾数部分的位数。所以这里不再详

细的介绍双精度的方式了,只将120.5的最后方式图给出,大家可以仔细想想为何是这样子的

下面我就这个基础知识点来解决一个我们的一个疑惑,请看下面一段程序,注意观察输出结果

floatf=2.2f;

doubled=(double)f;

Console.WriteLine(d.ToString(0.00000

文档评论(0)

guchengyong + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档