在前面的netty原始碼學習中經常看到FastThreadLocal的身影,這一篇我們將從ThreadLocal說起,來學習FastThreadLocal的設計(《ThreadLocal原始碼學習筆記》)
ThreadLocal是JDK中實現執行緒隔離的一個工具類。實現執行緒隔離maybe你第一反應會做出Map<Thread,V>
的設計,但是Map在高並行的情況下需要使用鎖or cas 來實現執行緒安全(如ConcurrentHashMap)鎖or cas都將帶來額外的開銷。
那麼ThreadLocal是如何實現的暱:
其基本結構如下:
細心的朋友這時候會指出:「key被回收了,value還存在哦,一樣可能存在記憶體漏失哦」
是的,但是ThreadLocal還留了一手:即在下次呼叫其他ThreadLocal#get,set的時候,會幫助我們清理
清理什麼?清理entry陣列中key為null的entry物件
為什麼可以清理,因為此Entry中的ThreadLocal失去了強參照,不會再被使用到了
妙!
下圖是線性探測法:如果找不到可以存放的位置,那麼繼續探測下去,直至擴容
那為什麼說ThreadLocal使用線性探測法妙暱?
其中時間效率這一點是建立在ThreadLocalMap中不會儲存太多元素導致hash衝突嚴重的情況下,如果元素太多ThreadLocalMap也會進行擴容
如上:當前元素大於負載的3/4那麼進行擴容
上面說了ThreadLocal的原理和其優秀設計,那麼為什麼還需要FastThreadLocal暱?
如同FastThreadLocal的名字一樣,它在高並行的情況下擁有更高的效能!
我們結合Netty原始碼看看netty是如何使用FastThreadLocal的
使用FastThreadLocalThread
netty在建立EventLoopGroup中的執行緒的時候,預設使用DefaultThreadFactory,它會建立出FastThreadLocalThread
至於為什麼要是有FastThreadLocalThread,我們後面再分析
將Runnable包裝為FastThreadLocalRunnable
Netty會使用FastThreadLocalRunnable對原Runnable進行包裝,確保Runnable指向完後進行FastThreadLocal#removeAll釋放
這一點再工作也經常使用,比如在分散式鏈路追蹤使用多執行緒處理業務邏輯,也需要將traceId對應的ThreadLocal進行傳遞和釋放,也是類似的手法。
使用
使用上和ThreadLocal類似
可以看到FastThreadLocalThread是繼承了Thread,其中內部有一個InternalThreadLocalMap型別的屬性,這便是FastThreadLocal實現的奧祕。
InternalThreadLocalMap 中有兩個關鍵的屬性
ThreadLocal<InternalThreadLocalMap> slowThreadLocalMap
,如果使用了FastThreadLocal,但是當前執行緒不是FastThread,那麼會從這個ThreadLocal中獲取InternalThreadLocalMap
indexedVariables,除0之外的位置儲存執行緒隔離資料,0位置儲存所有的FastThreadLocal物件
可以看到get就是獲取當前執行緒的InternalThreadLocalMap,然後根據index獲取內容(如果是預設值,那麼會呼叫initialize方法進行初始化)
每一個FastThreadLocal對應一個唯一的index,在FastThreadLocal構造的時候呼叫InternalThreadLocalMap#nextVariableIndex產生(使用AtomicInteger自旋+cas產生)
如下是InternalThreadLocalMap#get方法原始碼,可以看到根據當前執行緒是否是FastThreadLocalThread有不同的動作
如果是FastThreadLocalThread那麼直接獲取屬性即可
如果非FastThreadLocalThread那麼從ThreadLocal<InternalThreadLocalMap> slowThreadLocalMap
中獲取
如果FastThreadLocal中沒用值,那麼會呼叫initialValue進行初始化,initialValue是netty留給子類的擴充套件的方法
初始化之後會設定到InternalThreadLocalMap中,並呼叫addToVariablesToRemove將當前FastThreadLocal加入到variablesToRemove中,variablesToRemove位於InternalThreadLocalMap陣列的0位置,即如下紅色框內容
可以看到如果存入的值不是預設值,那麼呼叫setKnownNotUnset進行設定
反之呼叫remove進行刪除
setIndexedVariable 就是向InternalThreadLocalMap中設定內容,
在當前index小於陣列長度的時候會直接進行設定
如果舊值是UNSET預設值那麼說明之前沒用設定過,進而呼叫addToVariablesToRemove將當前FastThreadLocal設定到InternalThrealLocal陣列下標為1的Set中
如果當前index大於等於陣列長度,相當於出現了hash衝突,這時候不會進行拉鍊,也不會進行線性探測,而是擴容,擴容邏輯如下
首先是擴容到最接近當前index且大於index的2次冪大小(和hashMap一個道理)然後進行Arrays#copy實現陣列拷貝,並儲存當前值
這裡可以看出FastThreadLocal快在哪裡,設定值的時候使用擴容來解決hash衝突,雖然導致了一些空間的浪費,但是這也使得get的時候可以根據index直接獲取資料,避免了線性探測的定址,從而有更高的效能!
remove分為兩步,一是從InternalThreadLocalMap中移除index對應的元素,然後從InternalThreadLocal下標為0的Set中刪除
FastThreadLocalRunnable在run方法指向完後自動指向此方法,即刪除當前執行緒所有的FastThreadLocal內容,避免記憶體漏失
空間換時間,ThreadLocal慢線上性探測,那麼直接通過更大陣列空間的開闢,避免線性探測,這是一種空間換時間的思想
追求極致的效能,使用弱參照帶來如下缺點
GC開銷:弱參照需要GC垃圾收集器額外的工作來確定何時回收物件,netty這種對效能敏感的網路框架,頻繁的gc帶來不可預測的延遲
存取速度:使用弱參照可以讓Entry中key被回收,但是value還是存在,因此ThreadLocal會在get,set,等方法中檢測key為null的元素進行刪除,這也會帶來一定的開銷
顯示控制:上面我們看到,FastThreadLocalThread會將runnable進行包裝保證最後進行釋放,一定程度上保證
結合FastThreadLocal的原理,我們只要我不顯示釋放,也不讓Runnable保證為FastThreadLocalRunnable,那麼就不會被釋放
如上這個例子,會持續輸出 "洩露啦",但是如果使用ThreadLocal,再下次使用ThreadLocal的get,set方法的時候就會自動進行清理!