谈到volatile关键字,大多数开发者都有一定了解,可以说是开发者非常熟悉,深入之后又非常陌生的一个关键字。相当于轻量的synchronized,也叫轻量级锁,与synchronized相比性能上开销较少,同时又具备了可见性、有序性以及部分原子性,是Java并发需中非常重要的一个关键字。这篇文章我们将从volatile底层原理上来深入剖析他是怎么保证可见性、有序性以及部分原子性的,同时也会总结一些volatile关键字的典型应用场景。
所谓原子性,就是说一个操作是一个完整的整体,在其他线程看来这个操作要么未开始,要么已完成,不会看到中间的操作过程,跟事务有点相似。
那为什么说volatile只具有“部分”原子性,因为从本质上来说volatile是不具备原子性的,他修饰的只是单个变量,大部分情况下单个变量的读取和赋值本身就具有原子性,但有一个例外,就是32位Java虚拟机下的long/double型变量操作。
在32位Java虚拟机下,long/double型变量的读写操作会分为两部分,先读写高32位,在读写低32位,或者相反,这样如果没有将变量声明为volatile变量,在多线程读写时就有可能导致结果不可预知,因为对单个long/double型变量的读写并不是一个整体,也就是不具备原子性,只有使用volatile修饰之后,对单个long/double型变量的读写才具备了原子性的特点。在64位Java虚拟机下,long/double型变量读写本身就具有原子性,如果只是为了简单的读写就不需要使用volatile修饰。
需要明白的是volatile仅仅只保证变量的读和写是原子性操作,并不能保证对变量的复合操作也是原子性的,这是需要注意的地方,最为经典的场景就是对单个变量进行自增和自减。
private volatile static int increaseI = 0; public static void main(String[] args) { for (int i = 0; i < 100000; i++) { Thread thread = new Thread(new Runnable() { @Override public void run() { increaseI++; } }, String.valueOf(i)); thread.start(); } while(Thread.activeCount()>1) Thread.yield(); System.out.println(increaseI); } 复制代码
如果大家经过测试,会发现很多时候,打印出来的结果不是100000。这就是因为volatile修饰的变量只能保证变量的读写是原子性的,而increaseI++是一个复合操作,他可以简单分为:
var = increaseI; //步骤1:将increaseI的值加载到寄存器var var = var + 1;//步骤2:将寄存器var的值增加1 increaseI = var;//步骤3:将寄存器var的值写入increaseI 复制代码
volatile只能保证第一步和第三部单个操作的原子性,并不能保证整个自增和自减过程的原子性,也就是说volatile修饰的increaseI++并不是原子操作。下图也可以说明这个问题:
关于可见性,在前面的《Java并发(2)- 聊聊happens-before》一文中说过,为了提高操作效率,共享变量的读写都是在线程的本地内存中进行的,当对变量进行更新后,并不会及时将变量的结果刷新回主内存,在多线程环境下,其他线程就不会及时读取到最新的变量值。我们可以从下面的代码来分析这一点。
private static boolean flag = false; private static void refershFlag() throws InterruptedException { Thread threadA = new Thread(new Runnable() { @Override public void run() { while (!flag) { //do something } } }); Thread threadB = new Thread(new Runnable() { @Override public void run() { flag = true; } }); DateFormat dateFormat = new SimpleDateFormat("yyyy/MM/dd HH:mm:ss"); System.out.println("threadA start" + dateFormat.format(new java.util.Date())); threadA.start(); Thread.sleep(100); threadB.start(); threadA.join(); System.out.println("threadA end" + dateFormat.format(new java.util.Date())); } //threadA start2018/07/25 16:48:41 复制代码
按正常逻辑来说B线程更新变量flag后,A线程应该马上退出,但实际上很多时候B线程并不会立刻退出,这是因为虚拟机考虑到共享变量没有采用volatile修饰,默认该变量不需要多线程访问,于是做了优化,导致flag共享变量没有及时刷新回主内存,同时其他线程也没有及时去主内存读取的结果。那我们给flag变量加上volatile标示会怎么样呢?
private volatile static boolean flag = false; //threadA start2018/07/25 16:48:59 //threadA end2018/07/25 16:48:59 复制代码
可以看到A线程马上退出了,从这点可以看出volatile的可见性。
JMM在happens-before规则的基础上保证了单线程和正确同步多线程的有序性,其中就有一条volatile变量规则:对一个volatile变量的写操作happen—before后面对该变量的读操作。
这其中有两点要注意:第一点,针对同一个volatile变量的写、读操作之间才有happens-before关系;第二点,有时间上的先后顺序,必须是写操作happen—before读操作。在《Java并发(2)- 聊聊happens-before》重排序的例子中就很好的说明了volatile禁止重排序的特性。
public class AAndB { int x = 0; int y = 0; int a = 0; int b = 0; public void awrite() { a = 1; x = b; } public void bwrite() { b = 1; y = a; } } public class AThread extends Thread{ private AAndB aAndB; public AThread(AAndB aAndB) { this.aAndB = aAndB; } @Override public void run() { super.run(); this.aAndB.awrite(); } } public class BThread extends Thread{ private AAndB aAndB; public BThread(AAndB aAndB) { this.aAndB = aAndB; } @Override public void run() { super.run(); this.aAndB.bwrite(); } } private static void testReSort() throws InterruptedException { AAndB aAndB = new AAndB(); for (int i = 0; i < 10000; i++) { AThread aThread = new AThread(aAndB); BThread bThread = new BThread(aAndB); aThread.start(); bThread.start(); aThread.join(); bThread.join(); if (aAndB.x == 0 && aAndB.y == 0) { System.out.println("resort"); } aAndB.x = aAndB.y = aAndB.a = aAndB.b = 0; } System.out.println("end"); } 复制代码
当A线程和B线程都出现了重排序可能会打印出resort,但将变量都变为volatile变量后便不会再出现这种状况。
1 用来标示状态量。 状态量标示就是通过一个boolean类型变量来判断逻辑是否需要执行。就是上面volatile的可见性中的代码:
Thread threadA = new Thread(new Runnable() { @Override public void run() { while (!flag) { //do something } } }); Thread threadB = new Thread(new Runnable() { @Override public void run() { flag = true; } }); 复制代码
如果使用synchronized或者锁写法上将会比较复杂,但如果用volatile来修饰变量就很好的解决了这个问题,保证了状态量的及时刷新回主内存同时其他线程也会强制更新。
2 double-check问题 double-check问题应该是volatile使用最多的场景了。如下代码所示:
public class DoubleCheck { private volatile static DoubleCheck instance = null; private DoubleCheck() { } public static DoubleCheck getInstance() { if (null == instance) { //步骤一 synchronized (DoubleCheck.class) { if (null == instance) { //步骤二 instance = new DoubleCheck(); //步骤三 } } } return instance; } public static void main(String[] args) throws InterruptedException { DoubleCheck doubleCheck = DoubleCheck.getInstance(); } } 复制代码
代码中步骤三并不是原子性的,和之前的自增有点类似,可以分为三步:
3.1 为DoubleCheck分配内存地址 alloc memory address
3.2 初始化对象DoubleCheck init DoubleCheck
3.3 将引用地址指向instance instance > memory address
在CPU看来3.2和3.3并不存在依赖关系,是有可能会重排序的,如果将3.2和3.3重排序:
线程2在步骤一时判断instance不为空的情况下,实际上对象并没有初始化,3.2并没有执行。导致接下来使用对象发生错误。此时使用volatile修饰instance变量就可以防止3.2和3.3重排序,这样就保证了多线程访问时代码的正确性。
我们可以查看到汇编代码中在使用volatile关键字后在步骤三中多了lock指令来保证当前执行的有序性: 不使用volatile:
使用volatile
在DoubleCheck的汇编代码中我们看到加了volatile关键字后汇编代码中多了一行lock指令,那么这个指令代表什么意思呢?
lock指令有两个功能:
简单来说就是lock指令可以实现缓存一致性。通过lock指令的这两个功能,我们就可以很简单的理解当共享变量flag用volatile修饰后,每次更新flag的值都会导致缓存行的数据强制刷新最新值到主内存,volatile变量之前的数据也会被刷新回主内存。同时其他线程必须到主内存读取最新flag的值。这样就实现了共享变量的可见性以及有序性。
参考资料: