对于 移位操作符 ,很多人既感到熟悉,又感到陌生。熟悉是因为移位操作符是最基本的操作符之一,几乎每种编程语言都包含这一操作符;陌生是因为除非是追求极致性能等罕见场景,否则也很难用得上它。打开JDK源码,你会发现移位操作符的身影极为常见,弄清楚它的用法,对阅读源码很有帮助。
移位操作是把数据看作是二进制数,然后将其向左或向右移动若干位的运算。在Java编程语言中,移位操作符包含三种,分别是 <<
(左移)、 >>
(带符号右移)和 >>>
(无符号右移),这三种操作符都只能作用于 long
、 int
、 short
、 byte
、 char
这四种基本的整型类型上。
左移操作符 <<
是将数据转换成二进制数后, 向左移若干位,高位丢弃,低位补零 。看如下例子:
public static void main(String[] args) { int i = -1; System.out.println("Before << , i's value is " + i); System.out.println("i's binary string is " + Integer.toBinaryString(i)); i <<= 10; System.out.println("After << , i's value is " + i); System.out.println("i's binary string is " + Integer.toBinaryString(i)); } 复制代码
Java的 int
占32位,因此对 i = -1
转换成二进制数,然后左移10位,其结果是左边高10位丢弃,右边低10位补 0
,再转换为十进制,得到 i = -1024
的结果。
因此,上述例子的输出结果为:
Before << , i's value is -1 i's binary string is 11111111111111111111111111111111 After << , i's value is -1024 i's binary string is 11111111111111111111110000000000 复制代码
众所周知,Java中整型表示负数时,最高位为符号位,正数为 0
,负数为 1
。 >>
是带符号的右移操作符,将数据转换成二进制数后, 向右移若干位,高位补符号位,低位丢弃 。对于正数作右移操作时,具体体现为高位补 0
;负数则补 1
。看如下例子:
public static void main(String[] args) { // 对正数进行右移操作 int i1 = 4992; System.out.println("Before >> , i1's value is " + i1); System.out.println("i1's binary string is " + Integer.toBinaryString(i1)); i1 >>= 10; System.out.println("After >> , i1's value is " + i1); System.out.println("i1's binary string is " + Integer.toBinaryString(i1)); // 对负数进行右移操作 int i2 = -4992; System.out.println("Before >> , i2's value is " + i2); System.out.println("i2's binary string is " + Integer.toBinaryString(i2)); i2 >>= 10; System.out.println("After >> , i2's value is " + i2); System.out.println("i2's binary string is " + Integer.toBinaryString(i2)); } 复制代码
例子中, i1 = 4992
转换成二进制数,右移10位,其结果是左边高10位补 0
,右边低10位丢弃,再转换为十进制,得到 i1 = 4
的结果。同理, i2 = -4992
,右移10位,左边高10位补 1
,右边低10位丢弃,得到 i2 = -5
的结果。
因此,上述例子的输出结果为:
Before >> , i1's value is 4992 i1's binary string is 1001110000000 After >> , i1's value is 4 i1's binary string is 100 Before >> , i2's value is -4992 i2's binary string is 11111111111111111110110010000000 After >> , i2's value is -5 i2's binary string is 11111111111111111111111111111011 复制代码
无符号右移操作符 >>>
与 >>
类似,都是将数据转换为二进制数后右移若干位,不同之处在于,不论负数与否,结果都是 高位补零,低位丢弃 。看如下例子:
public static void main(String[] args) { int i3 = -4992; System.out.println("Before >>> , i3's value is " + i3); System.out.println("i3's binary string is " + Integer.toBinaryString(i3)); i3 >>>= 10; System.out.println("After >>> , i3's value is " + i3); System.out.println("i3's binary string is " + Integer.toBinaryString(i3)); } 复制代码
同样对 i3 = -4992
进行操作,转换成二进制数后,右移10位,其结果为左边高10位补 0
,右边低10位丢弃,再转换成十进制,得到 i3 = 4194299
的结果。
因此,上述例子的输出结果为:
Before >>> , i3's value is -4992 i3's binary string is 11111111111111111110110010000000 After >>> , i3's value is 4194299 i3's binary string is 1111111111111111111011 复制代码
再看如下例子:
public static void main(String[] args) { byte b = -1; System.out.println("Before >> , b's value is " + b); System.out.println("b's binary string is " + Integer.toBinaryString(b)); b >>>= 6; System.out.println("After >> , b's value is " + b); System.out.println("b's binary string is " + Integer.toBinaryString(b)); } 复制代码
Java的 byte
占8位,按照前面讲述的原理,对 b = -1
转换为二进制数后,右移6位,左边高6位补 0
,右边低位丢弃,其结果应该是 b = 3
。
真的这样吗?我们看一下例子运行的结果:
Before >> , b's value is -1 b's binary string is 11111111111111111111111111111111 After >> , b's value is -1 b's binary string is 11111111111111111111111111111111 复制代码
运行结果与我们预期的结果不对!
原来,Java在处理 byte
、 short
、 char
的移位操作前,会 先将其转型成 int
类型,然后在进行操作 !特别地,当对这三者使用 <<=
、 >>=
和 >>>=
时,其实是得到对移位后的 int
进行低位截断后的结果!对例子改动一下进行验证:
public static void main(String[] args) { byte b = -1; System.out.println("Before >> , b's value is " + b); System.out.println("b's binary string is " + Integer.toBinaryString(b)); System.out.println("After >> , b's value is " + (b >>> 6)); System.out.println("b's binary string is " + Integer.toBinaryString(b >>> 6)); } 复制代码
在该例子中,没有使用 >>>=
对 b
进行再赋值,而是直接将 b >>> 6
进行输出(需要注意的是, b >>> 6
的结果为 int
类型),其输出如下:
Before >> , b's value is -1 b's binary string is 11111111111111111111111111111111 After >> , b's value is 67108863 b's binary string is 11111111111111111111111111 复制代码
因此,第一个例子中实际的运算过程应该是这样:
对于 short
和 char
的移位操作原理也一样,读者可以自行进行实验验证。
到目前为止的所有的例子中,移位的位数都在数值所占有的位数之内,比如对 int
类型的移位都没有超过32。那么如果对 int
类型移位超过32位会怎样?且看如下例子:
public static void main(String[] args) { int i4 = -1; System.out.println("Before >>> , i4's value is " + i4); System.out.println("i4's binary string is " + Integer.toBinaryString(i4)); System.out.println("After >>> 31 , i4's value is " + (i4 >>> 31)); System.out.println("i4's binary string is " + Integer.toBinaryString(i4 >>> 31)); System.out.println("After >>> 32 , i4's value is " + (i4 >>> 32)); System.out.println("i4's binary string is " + Integer.toBinaryString(i4 >>> 32)); System.out.println("After >>> 33 , i4's value is " + (i4 >>> 33)); System.out.println("i4's binary string is " + Integer.toBinaryString(i4 >>> 33)); } 复制代码
根据前面讲述的原理,对于 i4 >>> 31
我们很容易得出结果为 1
。
那么, i4 >>> 32
的结果会是 0
吗?
NO!Java对移位操作符的右操作数 rhs
有特别的处理,对于 int
类型,只取其低5位,也就是取 rhs % 32
的结果;对于long类型,只取其低6位,也即是取 rhs % 64
的结果。因此,对于 i4 >>> 32
,实际上是 i4 >>> (32 % 32)
,也即 i4 >>> 0
,结果仍然是 -1
。
同理,对于 i4 >>> 33
等同于 i4 >>> 1
,其结果为 2147483647
。
因此,上述例子的输出结果如下:
Before >>> , i4's value is -1 i4's binary string is 11111111111111111111111111111111 After >>> 31 , i4's value is 1 i4's binary string is 1 After >>> 32 , i4's value is -1 i4's binary string is 11111111111111111111111111111111 After >>> 33 , i4's value is 2147483647 i4's binary string is 1111111111111111111111111111111 复制代码
对于 long
类型也是同样的道理,读者可以自行进行实验验证。
移位操作符虽说是Java中最基本的操作符之一,但是若不彻底弄清楚其中细节,稍有不慎,便容易犯错。移位操作符实际上支持的类型只有 int
和 long
,编译器在对 short
、 byte
、 char
类型进行移位前,都会将其转换为 int
类型再操作。移位操作符在JDK源码中,最常见的用法便是将其当成是乘 *
或者除 /
操作符使用 :对一个整型左移一位,相当于乘以2;右移一位,相当于除以2。其中原因就是,相比于使用 *
和 /
,在Java代码里使用 <<
和 >>
转换成的指令码运行起来会更高效些。