如果你以前没了解过类似的坑,乍一看似乎觉得不可思议。但是某些语言下事实确实如此(比如 Javascript):
再看个例子,+1 后居然等于原数,没天理啊!
如果你不知道原因,跟着楼主一起来探究下精度丢失的过程吧。
事实上不仅仅是 Javascript,在很多语言中 0.1 + 0.2 都会得到 0.30000000000000004,为此还诞生了一个好玩的网站 0.30000000000000004 。究其根本,这些语言中的数字都是以 IEEE 754 双精度 64 位浮点数 来存储的,它的表示格式为:
(s) * (m) * (2^e)
s 是符号位,表示正负。m 是尾数,有 52 bits。e 是指数,有 11 bits,e 的范围是 [-1074, 971] ( ECMAScript 5 规范 ),这样其实很容易推出 Javascript 能表示的最大数为:
1 * (Math.pow(2, 53) - 1) * Math.pow(2, 971) = 1.7976931348623157e+308
而这个数也就是 Number.MAX_VALUE
的值。
同理可推得 Number.MIN_VALUE
的值:
1 * 1 * Math.pow(2, -1074) = 5e-324
需要注意的是, Number.MIN_VALUE
表示的是 最小的比零大的数 ,而不是最小的数,最小的数很显然是 -Number.MAX_VALUE。
可能你已经注意到,当计算 Number.MAX_VALUE
时, (Math.pow(2, 53) - 1)
的结果用二进制表示是 53 个 1,除了 m 表示的 52 个 bits 外,其实最前面的 1 bit 是 隐藏位 (隐藏位表示的永远是 1),设置隐藏位为的是能表示更大范围的数。
复习了一些组成原理的知识后,我们再回到 0.1 + 0.2 这道题本身。我们都知道,计算机中的数字都是 以二进制存储的 ,如果要计算 0.1 + 0.2 的结果,计算机会先把 0.1 和 0.2 分别转化成二进制,然后相加,最后再把相加得到的结果转为十进制。
我们先把 0.1 和 0.2 分别转化为二进制,十进制转为二进制这里就不多说了,整数部分 "除二取余,倒序排列",小数部分 "乘二取整,顺序排列"。也可以用 Javascript 的 toString(2)
方法验证转换的结果。
// 0.1 转化为二进制 0.0 0011 0011 0011 0011...(0011循环) // 0.2 转化为二进制 0.0011 0011 0011 0011 0011...(0011循环)
当然计算机并不能表示无限小数,毕竟只有有限的资源,于是我们得把它们用 IEEE 754 双精度 64 位浮点数 来表示:
e = -4; m = 1.1001100110011001100110011001100110011001100110011010 (52位) e = -3; m = 1.1001100110011001100110011001100110011001100110011010 (52位)
当然,真实的计算机存储中 m 并不会是一个小数,而是上面的小数点后的 52 bits,小数点前的 1 为 隐藏位 。
这里又出现一个问题,虽然我们已经明确 m 只能有 52 位(小数点后),但是如果第 53 位是 1,是该进位还是不进位?这里需要考虑 IEEE 754 Rounding modes ,可以看下这篇文章 浮点数解惑 ,或者听我简单地解释下。
关于默认的舍入规则,简单的说,如果 1.101 要保留一位小数,可能的值是 1.1 和 1.2,那么先看 1.101 和 1.1 或者 1.2 哪个值更接近,毫无疑问是 1.1,于是答案是 1.1。那么如果要保留两位小数呢?很显然要么是 1.10 要么是 1.11,而且又一样近,这时就要看这两个数哪个是偶数(末位是偶数),保留偶数为答案。综上,如果第 52 bit 和 53 bit 都是 1,那么是要进位的。
另外,相加时如果指数不一致,需要对齐,一般情况下是向右移,因为最右边的即使溢出了,损失的精度远远小于左边溢出。
接下去就不难了:
e = -4; m = 1.1001100110011001100110011001100110011001100110011010 (52位) + e = -3; m = 1.1001100110011001100110011001100110011001100110011010 (52位) --------------------------------------------------------------------------- e = -3; m = 0.1100110011001100110011001100110011001100110011001101 + e = -3; m = 1.1001100110011001100110011001100110011001100110011010 --------------------------------------------------------------------------- e = -3; m = 10.0110011001100110011001100110011001100110011001100111 --------------------------------------------------------------------------- e = -2; m = 1.0011001100110011001100110011001100110011001100110100(52位) --------------------------------------------------------------------------- = 0.010011001100110011001100110011001100110011001100110100 = 0.30000000000000004(十进制)
而 9007199254740992 + 1 = 9007199254740992
的推理过程大同小异。
9007199254740992 其实就是 2 ^ 53。
e = 0; m = 100000000000000000000000000000000000000000000000000000 (53个0) + e = 0; m = 1 --------------------------------------------------------------------------- e = 0; m = 100000000000000000000000000000000000000000000000000001
因为 m 只能有 52 位,而上面相加两数相加后 m 有 53 位(已经除去首位隐藏位),又因为 Rounding modes 的偶数原则,所以将 53 bit 的 1 舍去,所以大小跟 2 ^ 52 并没有变化,试想下,如果是 + 2,那么结果就不一样了。
事实上,当结果大于 Math.pow(2, 53) 时,会出现精度丢失,导致最终结果存在偏差,而当结果大于 Number.MAX_VALUE,直接返回 Infinity。
如果你觉得已经足够了解 IEEE 754 双精度 64 位浮点数 的运算性质了,不妨试试 玉伯 在 JavaScript 中小数和大整数的精度丢失 一文最后留下的思考题:
Number.MAX_VALUE + 1 == Number.MAX_VALUE; Number.MAX_VALUE + 2 == Number.MAX_VALUE; ... Number.MAX_VALUE + x == Number.MAX_VALUE; Number.MAX_VALUE + x + 1 == Infinity; ... Number.MAX_VALUE + Number.MAX_VALUE == Infinity; // 问题: // 1. x 的值是什么? // 2. Infinity - Number.MAX_VALUE == x + 1; 是 true 还是 false ?