关于ThreadLocal

一、概述

ThreadLocal虽与thread相似,然而它并不是一个Thread,而是线程局部变量,顾名思义,它就是为每一个使用该变量的线程都提供一个变量值的副本,其底层为弱引用map,它是Java中一种较为特殊的线程绑定机制,可以简单的理解为以当前线程为key的map(与真正实现稍有差异)。在多线程情况下,每一个线程都可以独立地改变自己的副本,而不会和其它线程的副本冲突。与锁机制相比,使用ThreadLocal消耗了内存,节约了cpu,属于以空间换时间的应用。

从thread的角度看,每个thread都保持一个对其threadlocal副本的引用,只要线程是活动的并且 ThreadLocal 实例是可访问的;在thread完成之后,其线程局部实例的所有副本都会被垃圾回收(除非存在对这些副本的其他引用,而关于何时GC,可自行百度java四类引用)。而通过ThreadLocal存取的数据,总是与当前线程相关,也就是说,JVM 为每个运行的线程,绑定了私有的本地实例存取空间,从而为多thread环境常出现的并发访问问题提供了一种隔离机制。那么ThreadLocal是如何做到为每一个thred维护变量的副本的呢?其实实现的思路很简单,在ThreadLocal类中有一个ThreadLocalMap,用于存储每一个线程的变量的副本。

二、API说明

ThreadLocal()
创建一个线程本地变量。

T get()
返回此线程局部变量的当前线程副本中的值,如果这是线程第一次调用该方法,则创建并初始化此副本。

protected T initialValue()
返回此线程局部变量的当前线程的初始值。最多在每次访问线程来获得每个线程局部变量时调用此方法一次,即线程第一次使用 get() 方法访问变量的时候。如果线程先于 get 方法调用 set(T) 方法,则不会在线程中再调用 initialValue 方法。而在程序中一般都重写initialValue方法,以给定一个特定的初始值。若该实现只返回 null;如果程序员希望将线程局部变量初始化为 null 以外的某个值,则必须为 ThreadLocal 创建子类,并重写此方法。通常,将使用匿名内部类。initialValue 的典型实现将调用一个适当的构造方法,并返回新构造的对象。

void remove()
移除此线程局部变量的值。这可能有助于减少线程局部变量的存储需求。如果再次访问此线程局部变量,那么在默认情况下它将拥有其 initialValue。

void set(T value)
将此线程局部变量的当前线程副本中的值设置为指定值。许多应用程序不需要这项功能,它们只依赖于 initialValue() 方法来设置线程局部变量的值。

三、实例

package concurrent;

import java.util.concurrent.atomic.AtomicInteger;
public class ThreadLocalDemo {
      public static void main(String []args){
             for(int i=0;i<5;i++){
            final Thread t = new Thread(){
           @Override
           public void run(){
          System.out.println(“当前线程:”+Thread.currentThread().getName()+”已分配 ID:”+ThreadId.get());
        }
   };
         t.start();
   }
}
static class ThreadId{
//一个递增的序列,使用AtomicInger原子变量保证线程安全
      private static final AtomicInteger nextId = new AtomicInteger(0);
//线程本地变量,为每个线程关联一个唯一的序号
      private static final ThreadLocal<Integer> threadId =
      new ThreadLocal<Integer>() {
     @Override
    protected Integer initialValue() {
         //相当于nextId++,由于nextId++这种操作是个复合操作而非原子操作,会有线程            //安全问题(可能在初始化时就获取到相同的ID,所以使用原子变量
        return nextId.getAndIncrement();
  }
};
//返回当前线程的唯一的序列,如果第一次get,会先调用initialValue,后面看源码就了解了
       public static int get() {
          return threadId.get();
     }
   }
}
运行结果:
当前线程:Thread-4,已分配ID:1
当前线程:Thread-0,已分配ID:0
当前线程:Thread-2,已分配ID:3
当前线程:Thread-1,已分配ID:4
当前线程:Thread-3,已分配ID:2
这个程序通过妙用ThreadLocal,既实现多线程并发,游兼顾数据的安全性。

四、总结

ThreadLocal使用场合主要解决多线程中数据数据因并发产生不一致问题。ThreadLocal为每个线程的中并发访问的数据提供一个副本,通过访问副本来运行业务,这样的结果是耗费了内存,单大大减少了线程同步所带来性能消耗,也减少了线程并发控制的复杂度。

ThreadLocal不能使用原子类型,只能使用Object类型。ThreadLocal的使用比synchronized要简单得多。

ThreadLocal和Synchonized都用于解决多线程并发访问。但是ThreadLocal与synchronized有本质的区别。synchronized是利用锁的机制,使变量或代码块在某一时该只能被一个线程访问。而ThreadLocal为每一个线程都提供了变量的副本,使得每个线程在某一时间访问到的并不是同一个对象,这样就隔离了多个线程对数据的数据共享。而Synchronized却正好相反,它用于在多个线程间通信时能够获得数据共享。

Synchronized用于线程间的数据共享,而ThreadLocal则用于线程间的数据隔离。

当然ThreadLocal并不能替代synchronized,它们处理不同的问题域。Synchronized用于实现同步机制,比ThreadLocal更加复杂。

五、ThreadLocal使用的一般步骤

1、在多线程的类(如ThreadDemo类)中,创建一个ThreadLocal对象threadXxx,用来保存线程间需要隔离处理的对象xxx。
2、在ThreadDemo类中,创建一个获取要隔离访问的数据的方法getXxx(),在方法中判断,若ThreadLocal对象为null时候,应该new()一个隔离访问类型的对象,并强制转换为要应用的类型。
3、在ThreadDemo类的run()方法中,通过getXxx()方法获取要操作的数据,这样可以保证每个线程对应一个数据对象,在任何时刻都操作的是这个对象。

六、threadlocal内存泄漏
强引用:内存不足时,对象不会被GC回收,对象为null时,可被GC回收;
软引用:内存不足时,对象可以被GC回收;
弱引用:GC发现了,就会被回收,一旦我不需要某个引用,JVM会自动帮我处理它,这样我就不需要做其它操作;
虚引用:虚引用的回收机制跟弱引用差不多,但是它被回收之前,会被放入ReferenceQueue中。而其它引用是被JVM回收后才被传入ReferenceQueue中的。由于这个机制,所以虚引用大多被用于引用销毁前的处理工作。同时,虚引用创建的时候,必须带有ReferenceQueue

ThreadLocal在ThreadLocalMap中是以一个弱引用身份被Entry中的Key引用的,因此如果ThreadLocal没有外部强引用来引用它,那么ThreadLocal会在下次JVM垃圾收集时被回收。这个时候就会出现Entry中Key已经被回收,出现一个null Key的情况,外部读取ThreadLocalMap中的元素是无法通过null Key来找到Value的。因此如果当前线程的生命周期很长,一直存在,那么其内部的ThreadLocalMap对象也一直生存下来,这些null key就存在一条强引用链的关系一直存在:Thread –> ThreadLocalMap–>Entry–>Value,这条强引用链会导致Entry不会回收,Value也不会回收,但Entry中的Key却已经被回收的情况,造成内存泄漏。但JVM团队已经考虑到这样的情况,并做了一些措施来保证ThreadLocal尽量不会内存泄漏:在ThreadLocal的get()、set()、remove()方法调用的时候会清除掉线程ThreadLocalMap中所有Entry中Key为null的Value,并将整个Entry设置为null,利于下次内存回收。

发表评论

电子邮件地址不会被公开。