Netty原始碼學習8——從ThreadLocal到FastThreadLocal(如何讓FastThreadLocal記憶體漏失doge)

2023-12-10 18:01:14

系列文章目錄和關於我

一丶引入

在前面的netty原始碼學習中經常看到FastThreadLocal的身影,這一篇我們將從ThreadLocal說起,來學習FastThreadLocal的設計(《ThreadLocal原始碼學習筆記》

二丶從ThreadLocal說起

ThreadLocal是JDK中實現執行緒隔離的一個工具類。實現執行緒隔離maybe你第一反應會做出Map<Thread,V>的設計,但是Map在高並行的情況下需要使用鎖or cas 來實現執行緒安全(如ConcurrentHashMap)鎖or cas都將帶來額外的開銷。

那麼ThreadLocal是如何實現的暱:

1.ThreadLocal基本結構

其基本結構如下:

細心的朋友這時候會指出:「key被回收了,value還存在哦,一樣可能存在記憶體漏失哦」

是的,但是ThreadLocal還留了一手:即在下次呼叫其他ThreadLocal#get,set的時候,會幫助我們清理

清理什麼?清理entry陣列中key為null的entry物件

為什麼可以清理,因為此Entry中的ThreadLocal失去了強參照,不會再被使用到了

妙!

2.4 使用線性探測法,而不是拉鍊法

下圖是線性探測法:如果找不到可以存放的位置,那麼繼續探測下去,直至擴容

那為什麼說ThreadLocal使用線性探測法妙暱?

  • 空間效率:ThreadLocal使用陣列儲存資料,意味著資料在記憶體上是連續的,可以更好的利用CPU快取減少定址開銷。如果使用拉鍊法將Entry來需要額外的儲存下一個元素的參照指標,帶來額外的開銷
  • 時間效率:通常ThreadLocal不會儲存太多元素,線性探測法在處理衝突時更快——因為陣列儲存在記憶體上更加連續,可以更好的利用記憶體預讀能力,避免了連結串列記憶體參照導致了快取未命中。

其中時間效率這一點是建立在ThreadLocalMap中不會儲存太多元素導致hash衝突嚴重的情況下,如果元素太多ThreadLocalMap也會進行擴容

如上:當前元素大於負載的3/4那麼進行擴容

三丶FastThreadLocal 原始碼淺析

上面說了ThreadLocal的原理和其優秀設計,那麼為什麼還需要FastThreadLocal暱?

如同FastThreadLocal的名字一樣,它在高並行的情況下擁有更高的效能!

1.FastThreadLocal最佳實踐

我們結合Netty原始碼看看netty是如何使用FastThreadLocal的

  • 使用FastThreadLocalThread

    netty在建立EventLoopGroup中的執行緒的時候,預設使用DefaultThreadFactory,它會建立出FastThreadLocalThread

    至於為什麼要是有FastThreadLocalThread,我們後面再分析

  • 將Runnable包裝為FastThreadLocalRunnable

    Netty會使用FastThreadLocalRunnable對原Runnable進行包裝,確保Runnable指向完後進行FastThreadLocal#removeAll釋放

    這一點再工作也經常使用,比如在分散式鏈路追蹤使用多執行緒處理業務邏輯,也需要將traceId對應的ThreadLocal進行傳遞和釋放,也是類似的手法。

  • 使用

    使用上和ThreadLocal類似

2.FastThreadLocalThread

可以看到FastThreadLocalThread是繼承了Thread,其中內部有一個InternalThreadLocalMap型別的屬性,這便是FastThreadLocal實現的奧祕。

3.InternalThreadLocalMap

InternalThreadLocalMap 中有兩個關鍵的屬性

  • ThreadLocal<InternalThreadLocalMap> slowThreadLocalMap,如果使用了FastThreadLocal,但是當前執行緒不是FastThread,那麼會從這個ThreadLocal中獲取InternalThreadLocalMap

  • indexedVariables,除0之外的位置儲存執行緒隔離資料,0位置儲存所有的FastThreadLocal物件

    可以看到get就是獲取當前執行緒的InternalThreadLocalMap,然後根據index獲取內容(如果是預設值,那麼會呼叫initialize方法進行初始化)

    每一個FastThreadLocal對應一個唯一的index,在FastThreadLocal構造的時候呼叫InternalThreadLocalMap#nextVariableIndex產生(使用AtomicInteger自旋+cas產生)

    如下是InternalThreadLocalMap#get方法原始碼,可以看到根據當前執行緒是否是FastThreadLocalThread有不同的動作

    如果是FastThreadLocalThread那麼直接獲取屬性即可

    如果非FastThreadLocalThread那麼從ThreadLocal<InternalThreadLocalMap> slowThreadLocalMap中獲取

    3.2 initialize

    如果FastThreadLocal中沒用值,那麼會呼叫initialValue進行初始化,initialValue是netty留給子類的擴充套件的方法

    初始化之後會設定到InternalThreadLocalMap中,並呼叫addToVariablesToRemove將當前FastThreadLocal加入到variablesToRemove中,variablesToRemove位於InternalThreadLocalMap陣列的0位置,即如下紅色框內容

    3.3 set

    可以看到如果存入的值不是預設值,那麼呼叫setKnownNotUnset進行設定

    反之呼叫remove進行刪除

    3.3.1 setKnownNotUnset

    setIndexedVariable 就是向InternalThreadLocalMap中設定內容,

    • 在當前index小於陣列長度的時候會直接進行設定

      如果舊值是UNSET預設值那麼說明之前沒用設定過,進而呼叫addToVariablesToRemove將當前FastThreadLocal設定到InternalThrealLocal陣列下標為1的Set中

    • 如果當前index大於等於陣列長度,相當於出現了hash衝突,這時候不會進行拉鍊,也不會進行線性探測,而是擴容,擴容邏輯如下

      首先是擴容到最接近當前index且大於index的2次冪大小(和hashMap一個道理)然後進行Arrays#copy實現陣列拷貝,並儲存當前值

      這裡可以看出FastThreadLocal快在哪裡,設定值的時候使用擴容來解決hash衝突,雖然導致了一些空間的浪費,但是這也使得get的時候可以根據index直接獲取資料,避免了線性探測的定址,從而有更高的效能!

    3.4 remove

    remove分為兩步,一是從InternalThreadLocalMap中移除index對應的元素,然後從InternalThreadLocal下標為0的Set中刪除

    3.5 removeAll

    FastThreadLocalRunnable在run方法指向完後自動指向此方法,即刪除當前執行緒所有的FastThreadLocal內容,避免記憶體漏失

    四丶總結與思考

    1.FastThreadLocal快在哪裡

    空間換時間,ThreadLocal慢線上性探測,那麼直接通過更大陣列空間的開闢,避免線性探測,這是一種空間換時間的思想

    2. FastThreadLocal為什麼不使用弱參照

    追求極致的效能,使用弱參照帶來如下缺點

    • GC開銷:弱參照需要GC垃圾收集器額外的工作來確定何時回收物件,netty這種對效能敏感的網路框架,頻繁的gc帶來不可預測的延遲

    • 存取速度:使用弱參照可以讓Entry中key被回收,但是value還是存在,因此ThreadLocal會在get,set,等方法中檢測key為null的元素進行刪除,這也會帶來一定的開銷

    • 顯示控制:上面我們看到,FastThreadLocalThread會將runnable進行包裝保證最後進行釋放,一定程度上保證

    3.如何讓FastThreadLocal記憶體漏失 doge

    結合FastThreadLocal的原理,我們只要我不顯示釋放,也不讓Runnable保證為FastThreadLocalRunnable,那麼就不會被釋放

    如上這個例子,會持續輸出 "洩露啦",但是如果使用ThreadLocal,再下次使用ThreadLocal的get,set方法的時候就會自動進行清理!