最近进入项目组开发,偶尔翻阅别人代码时,看到如下注释。
注:该ThreadLocalUtil 就是内部使用 ThreadLocal 内部静态变量。
刚看到时完全不解,不知道其为什么这么说。当同事跟我解释原因,豁然开朗。细想,我们在工作使用中,如果不注意很容易就忽略这个问题。 在解释这个问题先,我们先来查看 ThreadLocal。
ThreadLocal 提供线程局部(thread-local)变量,为每个线程创建单独的变量副本,这样在多线程环境的下,由于每个线程都有单独的变量,不会因为变量共享导致的并发问题。当然相关问题我可以们使用同步机制解决该问题。
同步机制跟 ThreadLocal 区别
使用同步机制,多线程环境共享同一变量,这需要我们在使用时显示加锁,保证变量在同一时间只有一个线程能使用,相当于采用时间策略换取线程安全。
使用 ThreadLocal,每个线程拥有自己独立变量副本,相当于采用空间策略换取线程安全。
我们从代码查看下两种方式的区别。现在假如我们需要当前一个时间工具类,如下:
private final static SimpleDateFormat format = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss"); public static String getDateStr(Date date) { return format.format(date); }
查看上面 Demo,我们很容易可以看出上面方法由于是 SimpleDateFormat 不是线程安全,从而导致 getDateStr 方法非线程安全。
现在我们使用同步对其改造。
private final static SimpleDateFormat format = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss"); public static synchronized String getDateStrSync(Date date) { return format.format(date); }
这样使用显示加锁,避免多线程环境下线程安全。但是这种方式可能在高并发情况影响效率。
下面使用 ThreadLocal 对其改造。
private final static ThreadLocal<SimpleDateFormat> formatLocal = new ThreadLocal<SimpleDateFormat>() { protected synchronized SimpleDateFormat initialValue() { return new SimpleDateFormat("yyyy-MM-dd HH:mm:ss"); } }; public static String getDateByLocal(Date date){ return formatLocal.get().format(date); }
使用 ThreadLocal,将共享变量变成独享变量,保证线程安全。但是该种方案增加创建对象的开销。
综上,如何选择上述两种方式,需要结合当前业务方式选择。
讲完 ThreadLocal,我们来看下的 dubbo 的线程模型。
dubbo 默认采用单一长连接加线程池方式处理调用。
默认采取 Dispatcher=all 的分发策略,所有消息都派发到线程池,包括请求,响应,连接事件,断开事件,心跳等。线程池在缺省配置为固定大小线程池,启动时建立线程,不关闭,一直持有。默认为100个线程。
在 Dubbo 中使用 ThreadLocal ,如果采用默认的设置,每次 Dubbo 调用结束,Dubbo 处理响应线程并不会被销毁, 而是归还到线程池中。而从 ThreadLocal 源码可以看出,每次我们设置的值其实会存在位于 Thread 中 ThreadLocalMap 变量中。
这就导致,下次如果 Dubbo 处理响应恰好继续使用到这个线程,该线程就能调用到上次响应中设置在 ThreadLocal 设置的值。这就引起内存泄露,可能还会导致业务上异常。其实并不止在 Dubbo 中,该案例还会发生在 web项目中,只要相关使用线程池的,都有可能发生。