现在的位置: 首页 > 综合 > 正文

【C++复习四】浮点型数据double、float

2014年01月29日 ⁄ 综合 ⁄ 共 764字 ⁄ 字号 评论关闭

以前呢,只知道double是双精度的,而float是单精度的,却没有深究是为什么,以及双精度和单精度都是指什么。

最近看了一些网上的解释,略有心得。

首先,探讨一下存储结构。

浮点数是以科学计数法存储的。科学计数法应该都知道的,不过电脑中一般都是用E或者e来表示10的幂。

例如

122.5=1.225*10e2;
0.01225=1.225*10e-2

还有采用了什么二进制浮点算法的 IEC 60559:1989 (IEEE 754) 标准,

  符号位 指数位 尾数位
float 1 8 23
double 1 11 52

符号位代表正负,正为0,负为1;指数位代表e后面的数字,尾数就是基数了,像上面的1.225就叫尾数。

指数偏移值是指在存储的时候指数需要加上一个偏移值,该标准规定偏移值为2^(e-1)-1;float就需要偏移128-1=127;

例如本来是6的话,存进去就是127+6=133;

尾数存储也有讲究,因为尾数总是等于1.xxxxx。所以计算机中只存储小数点后面的部分。

举个例子就应该很好理解了

(120.5)十进制转换成二进制就是1111000.1,科学计数法表示就是1.1110001*(2^6),所以符号位是0,指数位是127+6=133;尾数位就是1110001,不足的用0补齐。

float的表示法就是

符号位 指数位 尾数位
0 1000 0101 111 0001 0000 0000 0000
0 127+6 1110001
float 4 3.4E +/- 38 (7 digits)
double 8 1.7E +/- 308 (15 digits) <—这个指15 个十进制位

还有就是浮点数比较是否相等的问题了,因为表示方法的问题,有可能1.0会被表示成0.9999999999或者1.00000000001什么的,建议的方法是定义一个两个值之间可以接受的误差,例如0.000000000001;

抱歉!评论已关闭.