工作面試中經常遇到ThreadLocal,但是很多同學並不瞭解ThreadLocal實現原理,到底為什麼會發生記憶體漏失也是一知半解?今天一燈帶你深入剖析ThreadLocal原始碼,總結ThreadLocal使用規範,解析ThreadLocal高頻面試題。
ThreadLocal是執行緒本地變數,就是執行緒的私有變數,不同執行緒之間相互隔離,無法共用,相當於每個執行緒拷貝了一份變數的副本。
目的就是在多執行緒環境中,無需加鎖,也能保證資料的安全性。
/**
* @author 一燈架構
* @apiNote ThreadLocal範例
**/
public class ThreadLocalDemo {
// 1. 建立ThreadLocal
static ThreadLocal<String> threadLocal = new ThreadLocal<>();
public static void main(String[] args) {
// 2. 給ThreadLocal賦值
threadLocal.set("關注公眾號:一燈架構");
// 3. 從ThreadLocal中取值
String result = threadLocal.get();
System.out.println(result); // 輸出 關注公眾號:一燈架構
// 4. 刪除ThreadLocal中的資料
threadLocal.remove();
System.out.println(threadLocal.get()); // 輸出null
}
}
ThreadLocal的用法非常簡單,建立ThreadLocal的時候指定泛型型別,然後就是賦值、取值、刪除值的操作。
不同執行緒之間,ThreadLocal資料是隔離的,測試一下:
/**
* @author 一燈架構
* @apiNote ThreadLocal範例
**/
public class ThreadLocalDemo {
// 1. 建立ThreadLocal
static ThreadLocal<Integer> threadLocal = new ThreadLocal<>();
public static void main(String[] args) {
IntStream.range(0, 5).forEach(i -> {
// 建立5個執行緒,分別給threadLocal賦值、取值
new Thread(() -> {
// 2. 給ThreadLocal賦值
threadLocal.set(i);
// 3. 從ThreadLocal中取值
System.out.println(Thread.currentThread().getName()
+ "," + threadLocal.get());
}).start();
});
}
}
輸出結果:
Thread-2,2
Thread-4,4
Thread-1,1
Thread-0,0
Thread-3,3
可以看出不同執行緒之間的ThreadLocal資料相互隔離,互不影響,這樣的實現效果有哪些應用場景呢?
ThreadLocal的應用場景主要分為兩類:
避免物件在方法之間層層傳遞,打破層次間約束。
比如使用者資訊,在很多地方都需要用到,層層往下傳遞,比較麻煩。這時候就可以把使用者資訊放到ThreadLocal中,需要的地方可以直接使用。
拷貝物件副本,減少初始化操作,並保證資料安全。
比如資料庫連線、Spring事務管理、SimpleDataFormat格式化日期,都是使用的ThreadLocal,即避免每個執行緒都初始化一個物件,又保證了多執行緒下的資料安全。
使用ThreadLocal保證SimpleDataFormat格式化日期的執行緒安全,程式碼類似下面這樣:
/**
* @author 一燈架構
* @apiNote ThreadLocal範例
**/
public class ThreadLocalDemo {
// 1. 建立ThreadLocal
static ThreadLocal<SimpleDateFormat> threadLocal =
ThreadLocal.withInitial(() -> new SimpleDateFormat("yyyy-MM-dd HH:mm:ss"));
public static void main(String[] args) {
IntStream.range(0, 5).forEach(i -> {
// 建立5個執行緒,分別從threadLocal取出SimpleDateFormat,然後格式化日期
new Thread(() -> {
try {
System.out.println(threadLocal.get().parse("2022-11-11 00:00:00"));
} catch (ParseException e) {
throw new RuntimeException(e);
}
}).start();
});
}
}
ThreadLocal底層使用ThreadLocalMap儲存資料,而ThreadLocalMap內部是一個陣列,陣列裡面儲存的是Entry物件,Entry物件裡面使用key-value儲存資料,key是ThreadLocal範例物件本身,value是ThreadLocal的泛型物件值。
static class ThreadLocalMap {
// Entry物件,WeakReference是弱參照,當沒有參照指向時,會被GC回收
static class Entry extends WeakReference<ThreadLocal<?>> {
// ThreadLocal泛型物件值
Object value;
// 構造方法,傳參是key-value
// key是ThreadLocal物件範例,value是ThreadLocal泛型物件值
Entry(ThreadLocal<?> k, Object v) {
super(k);
value = v;
}
}
// Entry陣列,用來儲存ThreadLocal資料
private Entry[] table;
// 陣列的預設容量大小
private static final int INITIAL_CAPACITY = 16;
// 擴容的閾值,預設是陣列大小的三分之二
private int threshold;
private void setThreshold(int len) {
threshold = len * 2 / 3;
}
}
// 給ThreadLocal設值
public void set(T value) {
// 獲取當前執行緒物件
Thread t = Thread.currentThread();
// 獲取此執行緒物件中的ThreadLocalMap物件
ThreadLocalMap map = getMap(t);
// 如果ThreadLocal已經設過值,直接設值,否則初始化
if (map != null)
// 設值的key就是當前ThreadLocal物件範例,value是ThreadLocal泛型物件值
map.set(this, value);
else
// 初始化ThreadLocalMap
createMap(t, value);
}
再看一下實際的set方法原始碼:
// key就是當前ThreadLocal物件範例,value是ThreadLocal泛型物件值
private void set(ThreadLocal<?> key, Object value) {
// 獲取ThreadLocalMap中的Entry陣列
Entry[] tab = table;
int len = tab.length;
// 計算key在陣列中的下標,也就是ThreadLocal的hashCode和陣列大小-1取餘
int i = key.threadLocalHashCode & (len - 1);
// 查詢流程:從下標i開始,判斷下標位置是否有值,
// 如果有值判斷是否等於當前ThreadLocal物件範例,等於就覆蓋,否則繼續向後遍歷陣列,直到找到空位置
for (Entry e = tab[i];
e != null;
// nextIndex 就是讓在不超過陣列長度的基礎上,把陣列的索引位置 + 1
e = tab[i = nextIndex(i, len)]) {
ThreadLocal<?> k = e.get();
// 如果等於當前ThreadLocal物件範例,直接覆蓋
if (k == key) {
e.value = value;
return;
}
// 當前key是null,說明ThreadLocal物件範例已經被GC回收了,直接覆蓋
if (k == null) {
replaceStaleEntry(key, value, i);
return;
}
}
// 找到空位置,建立Entry物件
tab[i] = new Entry(key, value);
int sz = ++size;
// 當陣列大小大於等於擴容閾值(陣列大小的三分之二)時,進行擴容
if (!cleanSomeSlots(i, sz) && sz >= threshold)
rehash();
}
set方法具體流程如下:
從原始碼和流程圖中得知,ThreadLocal是通過線性探測法解決雜湊衝突的,線性探測法具體賦值流程如下:
線性探測法這種特殊的賦值流程,導致取值的時候,也要走一遍類似的流程。
// 從ThreadLocal從取值
public T get() {
// 獲取當前執行緒物件
Thread t = Thread.currentThread();
// 獲取此執行緒物件中的ThreadLocalMap物件
ThreadLocalMap map = getMap(t);
if (map != null) {
// 通過ThreadLocal範例物件作為key,在Entry陣列中查詢資料
ThreadLocalMap.Entry e = map.getEntry(this);
// 如果不為空,表示找到了,直接返回
if (e != null) {
T result = (T)e.value;
return result;
}
}
// 如果ThreadLocalMap是null,就執行初始化ThreadLocalMap操作
return setInitialValue();
}
再看一下具體的遍歷Entry陣列的邏輯:
// 具體的遍歷Entry陣列的方法
private Entry getEntry(ThreadLocal<?> key) {
// 通過hashcode計算陣列下標位置
int i = key.threadLocalHashCode & (table.length - 1);
Entry e = table[i];
// 如果下標位置物件不為空,並且等於當前ThreadLocal範例物件,直接返回
if (e != null && e.get() == key)
return e;
else
// 如果不是,需要繼續向下遍歷Entry陣列
return getEntryAfterMiss(key, i, e);
}
再看一下線性探測法特殊的取值方法:
// 如果不是,需要繼續向下遍歷Entry陣列
private Entry getEntryAfterMiss(ThreadLocal<?> key, int i, Entry e) {
Entry[] tab = table;
int len = tab.length;
// 迴圈遍歷陣列,直到找到ThreadLocal物件,或者遍歷到陣列為空的位置
while (e != null) {
ThreadLocal<?> k = e.get();
// 如果等於當前ThreadLocal範例物件,表示找到了,直接返回
if (k == key)
return e;
// key是null,表示ThreadLocal範例物件已經被GC回收,就幫忙清除value
if (k == null)
expungeStaleEntry(i);
else
// 索引位置+1,表示繼續向下遍歷
i = nextIndex(i, len);
e = tab[i];
}
return null;
}
// 索引位置+1,表示繼續向下遍歷,遍歷到陣列結尾,再從頭開始遍歷
private static int nextIndex(int i, int len) {
return ((i + 1 < len) ? i + 1 : 0);
}
ThreadLocal的get方法流程如下:
remove方法流程跟set、get方法類似,都是遍歷陣列,找到ThreadLocal範例物件後,刪除key、value,再刪除Entry物件結束。
public void remove() {
// 獲取當前執行緒的ThreadLocalMap物件
ThreadLocalMap m = getMap(Thread.currentThread());
if (m != null)
m.remove(this);
}
// 具體的刪除方法
private void remove(ThreadLocal<?> key) {
ThreadLocal.ThreadLocalMap.Entry[] tab = table;
int len = tab.length;
// 計算陣列下標
int i = key.threadLocalHashCode & (len - 1);
// 遍歷陣列,直到找到空位置,
// 或者值等於當前ThreadLocal物件,才結束
for (ThreadLocal.ThreadLocalMap.Entry e = tab[i];
e != null;
e = tab[i = nextIndex(i, len)]) {
// 找到後,刪除key、value,再刪除Entry物件
if (e.get() == key) {
e.clear();
expungeStaleEntry(i);
return;
}
}
}
使用ThreadLocal結束,一定要呼叫remove方法,清理掉threadLocal資料。具體流程類似下面這樣:
/**
* @author 一燈架構
* @apiNote ThreadLocal範例
**/
public class ThreadLocalDemo {
// 1. 建立ThreadLocal
static ThreadLocal<User> threadLocal = new ThreadLocal<>();
public void method() {
try {
User user = getUser();
// 2. 給threadLocal賦值
threadLocal.set(user);
// 3. 執行其他業務邏輯
doSomething();
} finally {
// 4. 清理threadLocal資料
threadLocal.remove();
}
}
}
如果忘了呼叫remove方法,可能會導致兩個嚴重的問題:
導致記憶體溢位
如果執行緒的生命週期很長,一直往ThreadLocal中放資料,卻沒有刪除,最終產生OOM
導致資料錯亂
如果使用了執行緒池,一個執行緒執行完任務後並不會被銷燬,會繼續執行下一個任務,導致下個任務存取到了上個任務的資料。
看完了ThreadLocal原始碼,再回答幾道面試題,檢驗一下學習成果怎麼樣。
ThreadLocal底層使用的ThreadLocalMap儲存資料,而ThreadLocalMap是執行緒Thread的私有變數,不同執行緒之間資料隔離,所以即使ThreadLocal的set、get、remove方法沒有加鎖,也能保證執行緒安全。
因為在一個執行緒中可以建立多個ThreadLocal範例物件,所以要用陣列儲存,而不是用一個物件。
ThreadLocal使用的線性探測法法解決雜湊衝突,線性探測法法具體賦值流程如下:
我們都知道HashMap採用的是鏈地址法(也叫拉鍊法)解決雜湊衝突,為什麼ThreadLocal要用線性探測法解決雜湊衝突?而不用鏈地址法呢?
我的猜想是可能是創作者偷懶、嫌麻煩,或者是ThreadLocal使用量較少,出現雜湊衝突概率較低,不想那麼麻煩。
使用鏈地址法需要引入連結串列和紅黑樹兩種資料結構,實現更復雜。而線性探測法沒有引入任何額外的資料結構,直接不斷遍歷陣列。
結果就是,如果一個執行緒中使用很多個ThreadLocal,發生雜湊衝突後,ThreadLocal的get、set效能急劇下降。
線性探測法相比鏈地址法優缺點都很明顯:
優點: 實現簡單,無需引入額外的資料結構。
缺點: 發生雜湊衝突後,ThreadLocal的get、set效能急劇下降。
先說一下弱參照的特點:
弱參照的物件擁有更短暫的生命週期,在垃圾回收器執行緒掃描它所管轄的記憶體區域的過程中,一旦發現了只具有弱參照的物件,不管當前記憶體空間足夠與否,都會回收它的記憶體。 不過,由於垃圾回收器是一個優先順序很低的執行緒,因此不一定會很快發現那些只具有弱參照的物件。
ThreadLocalMap的key設計成弱參照後,會不會我們正在使用,就被GC回收了?
這個是不會的,因為我們一直在強參照著ThreadLocal範例物件。
/**
* @author 一燈架構
* @apiNote ThreadLocal範例
**/
public class ThreadLocalDemo {
// 1. 建立ThreadLocal
static ThreadLocal<String> threadLocal = new ThreadLocal<>();
public static void main(String[] args) {
// 2. 給ThreadLocal賦值
threadLocal.set("關注公眾號:一燈架構");
// 3. 從ThreadLocal中取值
String result = threadLocal.get();
// 手動觸發GC
System.gc();
System.out.println(result); // 輸出 關注公眾號:一燈架構
}
}
由上面程式碼中得知,如果我們一直在使用threadLocal,觸發GC後,並不會threadLocal範例物件。
ThreadLocalMap的key設計成弱參照的目的就是:
防止我們在使用完ThreadLocal後,忘了呼叫remove方法刪除資料,導致陣列中ThreadLocal資料一直不被回收。
/**
* @author 一燈架構
* @apiNote ThreadLocal範例
**/
public class ThreadLocalDemo {
// 1. 建立ThreadLocal
static ThreadLocal<String> threadLocal = new ThreadLocal<>();
public static void main(String[] args) {
// 2. 給ThreadLocal賦值
threadLocal.set("關注公眾號:一燈架構");
// 3. 使用完threadLocal,設定成null,模仿生命週期結束
threadLocal = null;
// 觸發GC,這時候ThreadLocalMap的key就會被回收,但是value還沒有被回收。
// 只有等到下次執行get、set方法遍歷陣列,遍歷到這個位置,才會刪除這個無效的value
System.gc();
}
}
ThreadLocal出現記憶體漏失的原因,就是我們使用完ThreadLocal沒有執行remove方法刪除資料。
具體是哪些資料過多導致的記憶體漏失呢?
一個是陣列的Entry物件,Entry物件中key、value分別是ThreadLocal範例物件和泛型物件值。
因為我們在使用ThreadLocal的時候,總愛把ThreadLocal設定成類的靜態變數,直到執行緒生命週期結束,ThreadLocal物件資料才會被回收。
另一個是陣列中Entry物件的value值,也就是泛型物件值。雖然ThreadLocalMap的key被設定成弱參照,會被GC回收,但是value並沒有被回收。需要等到下次執行get、set方法遍歷陣列,遍歷到這個位置,才會刪除這個無效的value。這也是造成記憶體漏失的原因之一。
只需要InheritableThreadLocal即可,當初始化子執行緒的時候,會從父執行緒拷貝ThreadLocal資料。
/**
* @author 一燈架構
* @apiNote ThreadLocal範例
**/
public class ThreadLocalDemo {
// 1. 建立可被子執行緒繼承資料的ThreadLocal
static ThreadLocal<String> threadLocal = new InheritableThreadLocal<>();
public static void main(String[] args) {
// 2. 給ThreadLocal賦值
threadLocal.set("關注公眾號:一燈架構");
// 3. 啟動一個子執行緒,看是否能獲取到主執行緒資料
new Thread(() -> {
System.out.println(threadLocal.get()); // 輸出 關注公眾號:一燈架構
}).start();
}
}
我是「一燈架構」,如果本文對你有幫助,歡迎各位小夥伴點贊、評論和關注,感謝各位老鐵,我們下期見