转载

行到水穷处，坐看云起时 - JUC（一）

JUC（一）
- 线程池
- ThreadLocal
JUC（二）
- 锁
- CAS
JUC（三）
- 并发容器
- 并发流程
JUC（四）
- AQS
- 治理线程

线程池

一、相同的线程是如何执行不同的任务的？超过核心线程数的线程是如何被回收的？

先看一下线程池里面很重要的两个成员变量

/**
 * The queue used for holding tasks and handing off to worker
 * threads.
 */
private final BlockingQueue<Runnable> workQueue;
/**
 * Set containing all worker threads in pool. Accessed only when
 * holding mainLock.
 */
private final HashSet<Worker> workers = new HashSet<Worker>();
复制代码

这里的Worker即持有具体thread的工作线程，workQueue（阻塞队列）则是我们传入的一个个需要被执行的任务（run方法里面的内容）。其他的结构性的说明可以瞅瞅这篇美团技术团队的文章，写的特别好： https://tech.meituan.com/2020/04/02/java-pooling-pratice-in-meituan.html

那相同的线程是如何执行不同的任务的？

来看看线程池的runWorker方法

工作线程在执行完成一个任务以后，就会去阻塞队列获取新的任务，执行任务的run方法。

有一个挺有意思的地方：线程池在新任务进来时候，如果核心线程数没有满，则会去再开一个线程，而不是复用已存在的空闲的核心线程，因为runWork的方法，在getTask的地方会阻塞，但是他是阻塞在了获取队列中的task。

回收？保留？

上面说到，getTask会阻塞线程。这和回收保留有什么关系呢？我们来看看这段代码

可以很清晰的看到：核心线程永久阻塞，非核心线程则计时阻塞

ThreadLocal

二、ThreadLocal用在哪些场景？

每个需要一个独享的对象（通常是工具类，典型的有SimpleDateFormat和Random）
每个线程内需要保存的全局变量，例如拦截器中获取的用户信息

ThreadLocal是什么？

我们先看看它的存在方式，在Thread类里面有一个成员变量：

/* ThreadLocal values pertaining to this thread. This map is maintained
 * by the ThreadLocal class. */
ThreadLocal.ThreadLocalMap threadLocals = null;
复制代码

它被一个线程所携带，存放在一个map里面，这个map的key为ThreadLocal对象，value为你需要设置的值。

当我们调用ThreadLocal的set方法时，其实是把当前的threadlocal作为key，加上你的value，放入了当前线程的那个Map里面。

为什么需要使用ThreadLocal？

我们来一步步看一下如下场景（模拟大量请求得到服务的情况，在这条请求链路中，我们都需要使用相同的格式进行打印时间：从0-999）：

最暴力的方式，我们直接在每一个任务运行时候创建一个SimpleDateFormat对象，这样虽然没什么问题，但是1000个“相同”对象的创建和销毁，着实没有必要

public class ThreadLocalNormalUsage {

    public static ExecutorService threadPool = Executors.newFixedThreadPool(10);

    public static void main(String[] args) {
        for (int i = 0; i < 1000; i++) {
            int finalI = i;
            threadPool.submit(() -> {
                String date = new ThreadLocalNormalUsage().date(finalI);
                System.out.println(date);
                // 更多的service层任务
            });
        }
        threadPool.shutdown();
    }

    public String date(int seconds) {
        //参数的单位是毫秒，从1970.1.1 00:00:00 GMT计时
        Date date = new Date(1000 * seconds);
        SimpleDateFormat dateFormat = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss");
        return dateFormat.format(date);
    }
}
复制代码

那既然你说是相同的，直接使用全局的静态变量怎么样呢？是不是就解决问题了？

public class ThreadLocalNormalUsage {

    public static ExecutorService threadPool = Executors.newFixedThreadPool(10);
    static SimpleDateFormat dateFormat = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss");

    public static void main(String[] args) {
        for (int i = 0; i < 1000; i++) {
            int finalI = i;
            threadPool.submit(() -> {
                String date = new ThreadLocalNormalUsage().date(finalI);
                System.out.println(date);
                // 更多的service层任务
            });
        }
        threadPool.shutdown();
    }

    public String date(int seconds) {
        //参数的单位是毫秒，从1970.1.1 00:00:00 GMT计时
        Date date = new Date(1000 * seconds);
        return dateFormat.format(date);
    }
}
复制代码

现在问题就来了，居然出现了相同的时间打印，显然这是不应该的呀。

因为SimpleDateFormat在多线程访问下就会出现问题，因为他本身并不是线程安全的类。

这样的话，我们使用synchronized把关键操作保护起来如何？

public class ThreadLocalNormalUsage {

    public static ExecutorService threadPool = Executors.newFixedThreadPool(10);
    static SimpleDateFormat dateFormat = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss");

    public static void main(String[] args) {
        for (int i = 0; i < 1000; i++) {
            int finalI = i;
            threadPool.submit(() -> {
                String date = new ThreadLocalNormalUsage().date(finalI);
                System.out.println(date);
                // 更多的service层任务
            });
        }
        threadPool.shutdown();
    }

    public String date(int seconds) {
        //参数的单位是毫秒，从1970.1.1 00:00:00 GMT计时
        Date date = new Date(1000 * seconds);
        String s;
        synchronized (ThreadLocalNormalUsage.class) {
            s = dateFormat.format(date);
        }
        return s;
    }
}
复制代码

没错，这次结果正常了。

但是这样不行呀，使用同步保护后，所有并发的线程都在这排队，性能损耗岂不是很严重，这还得了。

好了，主角闪亮登场：对应线程池中的10个线程，我们为每一个线程创建一个SimpleDateFormat对象，这样既保证了并发安全，又节省了对象的开销

public class ThreadLocalNormalUsage {

    public static ExecutorService threadPool = Executors.newFixedThreadPool(10);

    public static void main(String[] args) {
        for (int i = 0; i < 1000; i++) {
            int finalI = i;
            threadPool.submit(() -> {
                String date = new ThreadLocalNormalUsage().date(finalI);
                System.out.println(date);
                // 更多的service层任务
            });
        }
        threadPool.shutdown();
    }

    public String date(int seconds) {
        //参数的单位是毫秒，从1970.1.1 00:00:00 GMT计时
        Date date = new Date(1000 * seconds);
        SimpleDateFormat dateFormat = ThreadSafeFormatter.dateFormatThreadLocal2.get();
        return dateFormat.format(date);
    }
}

/**
 * 两种效果一样的写法，都是重写initialValue方法
 * initialValue方法会延迟加载，在使用get方法时候才会触发
 */
class ThreadSafeFormatter {
    

    public static ThreadLocal<SimpleDateFormat> dateFormatThreadLocal = new ThreadLocal<SimpleDateFormat>() {
        @Override
        protected SimpleDateFormat initialValue() {
            return new SimpleDateFormat("yyyy-MM-dd HH:mm:ss");
        }
    };

    public static ThreadLocal<SimpleDateFormat> dateFormatThreadLocal2 = ThreadLocal
            .withInitial(() -> new SimpleDateFormat("yyyy-MM-dd HH:mm:ss"));
}
复制代码

再一种场景就是需要在整条链路传参（用户信息）了，我们虽然可以使用方法参数的方式，但是并不优雅，ThreadLocal的set、get了解一下

public class ThreadLocalNormalUsage {

    public static void main(String[] args) {
        new Service1().process("mrhe");

    }
}

class Service1 {

    public void process(String name) {
        User user = new User(name);
        UserContextHolder.holder.set(user);
        new Service2().process();
    }
}

class Service2 {

    public void process() {
        User user = UserContextHolder.holder.get();
        System.out.println("Service2拿到用户名：" + user.name);
        new Service3().process();
    }
}

class Service3 {

    public void process() {
        User user = UserContextHolder.holder.get();
        System.out.println("Service3拿到用户名：" + user.name);
        UserContextHolder.holder.remove();
    }
}

class UserContextHolder {
    public static ThreadLocal<User> holder = new ThreadLocal<>();
}

class User {

    String name;

    public User(String name) {
        this.name = name;
    }
}
复制代码

相关知识点

ThreadLocal导致内存泄露

为什么会内存泄露呢？会发生在哪儿？

我们先来分析一下ThreadLocal里面的那个Map

/**
 * The entries in this hash map extend WeakReference, using
 * its main ref field as the key (which is always a
 * ThreadLocal object).  Note that null keys (i.e. entry.get()
 * == null) mean that the key is no longer referenced, so the
 * entry can be expunged from table.  Such entries are referred to
 * as "stale entries" in the code that follows.
 */
static class Entry extends WeakReference<ThreadLocal<?>> {
    /** The value associated with this ThreadLocal. */
    Object value;

    Entry(ThreadLocal<?> k, Object v) {
        super(k);
        value = v;
    }
}
复制代码

显然，这个key使用的是弱引用，既然是弱引用，那内存泄露应该不是发生在这里（那就只有value咯~）。

正常情况下，当线程终止，保存在ThreadLocal里的value就会被垃圾回收，因为没有强引用了。但是，如果线程不终止（比如线程池中反复使用并保持的线程），那么key对应的value就不能被回收，因为有如下的调用链：

Thread -> ThreadLocalMap -> Entry(key为null) -> Value

因为这个强引用链路还存在，所以value就无法被回收，就可能出现OOM。JDK已经考虑到这个问题，所以在set、remove和rehash方法中会扫描key为null的Entry，进而把value置为null：

/**
 * Double the capacity of the table.
 */
private void resize() {
    Entry[] oldTab = table;
    int oldLen = oldTab.length;
    int newLen = oldLen * 2;
    Entry[] newTab = new Entry[newLen];
    int count = 0;

    for (int j = 0; j < oldLen; ++j) {
        Entry e = oldTab[j];
        if (e != null) {
            ThreadLocal<?> k = e.get();
            if (k == null) {
                e.value = null; // Help the GC
            } else {
                int h = k.threadLocalHashCode & (newLen - 1);
                while (newTab[h] != null)
                    h = nextIndex(h, newLen);
                newTab[h] = e;
                count++;
            }
        }
    }

    setThreshold(newLen);
    size = count;
    table = newTab;
}
复制代码

但是如果一个ThreadLocal不被使用，那么实际上set、rehash等方法也不再被调用，这时线程又不停止的话，就会内存泄漏了。也就是说，需要我们手动去remove。

话说回来，我们一般使用的是static的ThreadLocal，那JDK这个机制也就无效了。而且我们在使用线程池的时候，线程是会复用的，那这个时候为了防止无用value不断堆积又该怎么办呢？

那我们最好在每个任务执行完成的时候做一下必要的清理工作：

/**
 * 重写线程池中的方法
 */
protected void afterExecute(Runnable r, Throwable t) { 
    Thread.currentThread().threadLocals = null;
}
复制代码

原文 https://juejin.im/post/5eaa8e97e51d454db74367fd

正文到此结束

所属分类：编程技术 Java

本文标签： id db 多线程锁 Service GMT 线程 DOM ask MQ tab IDE 参数 queue HashSet tar HTML src 垃圾回收 java UI 美团线程池并发时间同步 executor 云 map value 文章 synchronized https 代码 final ORM rand 安全 key http
版权声明： 本文为互联网转载文章，出处已在文章中说明(部分除外)。如果侵权，请联系本站长删除，谢谢。
本文海报： 生成海报一生成海报二

其他链接

关于本站

本站定位：个人技术类博客

本站作用：写博客、记日志、闲聊扯淡鼓捣技术。

问题交流

行到水穷处，坐看云起时 - JUC（一）

线程池

一、相同的线程是如何执行不同的任务的？超过核心线程数的线程是如何被回收的？

那相同的线程是如何执行不同的任务的？

回收？保留？

ThreadLocal

二、ThreadLocal用在哪些场景？

ThreadLocal是什么？

为什么需要使用ThreadLocal？

相关知识点

ThreadLocal导致内存泄露

热门推荐

相关文章

说给你听

本文目录

随机标签

书籍教程

近期评论

网站信息

其他链接

关于本站

问题交流