Netty原始碼學習8——從ThreadLocal到FastThreadLocal(如何讓FastThreadLocal記憶體漏失doge)

一丶引入

在前面的netty原始碼學習中經常看到FastThreadLocal的身影，這一篇我們將從ThreadLocal說起，來學習FastThreadLocal的設計（《ThreadLocal原始碼學習筆記》）

二丶從ThreadLocal說起

ThreadLocal是JDK中實現執行緒隔離的一個工具類。實現執行緒隔離maybe你第一反應會做出Map<Thread,V>的設計，但是Map在高並行的情況下需要使用鎖or cas 來實現執行緒安全（如ConcurrentHashMap）鎖or cas都將帶來額外的開銷。

那麼ThreadLocal是如何實現的暱：

1.ThreadLocal基本結構

其基本結構如下：

細心的朋友這時候會指出：「key被回收了，value還存在哦，一樣可能存在記憶體漏失哦」

是的，但是ThreadLocal還留了一手：即在下次呼叫其他ThreadLocal#get，set的時候，會幫助我們清理

清理什麼？清理entry陣列中key為null的entry物件

為什麼可以清理，因為此Entry中的ThreadLocal失去了強參照，不會再被使用到了

妙！

2.4 使用線性探測法，而不是拉鍊法

下圖是線性探測法：如果找不到可以存放的位置，那麼繼續探測下去，直至擴容

那為什麼說ThreadLocal使用線性探測法妙暱？

空間效率：ThreadLocal使用陣列儲存資料，意味著資料在記憶體上是連續的，可以更好的利用CPU快取減少定址開銷。如果使用拉鍊法將Entry來需要額外的儲存下一個元素的參照指標，帶來額外的開銷
時間效率：通常ThreadLocal不會儲存太多元素，線性探測法在處理衝突時更快——因為陣列儲存在記憶體上更加連續，可以更好的利用記憶體預讀能力，避免了連結串列記憶體參照導致了快取未命中。

其中時間效率這一點是建立在ThreadLocalMap中不會儲存太多元素導致hash衝突嚴重的情況下，如果元素太多ThreadLocalMap也會進行擴容

如上：當前元素大於負載的3/4那麼進行擴容

三丶FastThreadLocal 原始碼淺析

上面說了ThreadLocal的原理和其優秀設計，那麼為什麼還需要FastThreadLocal暱？

如同FastThreadLocal的名字一樣，它在高並行的情況下擁有更高的效能！

1.FastThreadLocal最佳實踐

我們結合Netty原始碼看看netty是如何使用FastThreadLocal的

使用FastThreadLocalThread

netty在建立EventLoopGroup中的執行緒的時候，預設使用DefaultThreadFactory，它會建立出FastThreadLocalThread

至於為什麼要是有FastThreadLocalThread，我們後面再分析
將Runnable包裝為FastThreadLocalRunnable

Netty會使用FastThreadLocalRunnable對原Runnable進行包裝，確保Runnable指向完後進行FastThreadLocal#removeAll釋放

這一點再工作也經常使用，比如在分散式鏈路追蹤使用多執行緒處理業務邏輯，也需要將traceId對應的ThreadLocal進行傳遞和釋放，也是類似的手法。
使用

使用上和ThreadLocal類似

2.FastThreadLocalThread

可以看到FastThreadLocalThread是繼承了Thread，其中內部有一個InternalThreadLocalMap型別的屬性，這便是FastThreadLocal實現的奧祕。

3.InternalThreadLocalMap

InternalThreadLocalMap 中有兩個關鍵的屬性

ThreadLocal<InternalThreadLocalMap> slowThreadLocalMap，如果使用了FastThreadLocal，但是當前執行緒不是FastThread，那麼會從這個ThreadLocal中獲取InternalThreadLocalMap
indexedVariables，除0之外的位置儲存執行緒隔離資料，0位置儲存所有的FastThreadLocal物件

可以看到get就是獲取當前執行緒的InternalThreadLocalMap，然後根據index獲取內容（如果是預設值，那麼會呼叫initialize方法進行初始化）

每一個FastThreadLocal對應一個唯一的index，在FastThreadLocal構造的時候呼叫InternalThreadLocalMap#nextVariableIndex產生（使用AtomicInteger自旋+cas產生）

如下是InternalThreadLocalMap#get方法原始碼，可以看到根據當前執行緒是否是FastThreadLocalThread有不同的動作

如果是FastThreadLocalThread那麼直接獲取屬性即可

如果非FastThreadLocalThread那麼從ThreadLocal<InternalThreadLocalMap> slowThreadLocalMap中獲取

3.2 initialize

如果FastThreadLocal中沒用值，那麼會呼叫initialValue進行初始化，initialValue是netty留給子類的擴充套件的方法

初始化之後會設定到InternalThreadLocalMap中，並呼叫addToVariablesToRemove將當前FastThreadLocal加入到variablesToRemove中，variablesToRemove位於InternalThreadLocalMap陣列的0位置，即如下紅色框內容

3.3 set

可以看到如果存入的值不是預設值，那麼呼叫setKnownNotUnset進行設定

反之呼叫remove進行刪除

3.3.1 setKnownNotUnset

setIndexedVariable 就是向InternalThreadLocalMap中設定內容，
- 在當前index小於陣列長度的時候會直接進行設定
  
  如果舊值是UNSET預設值那麼說明之前沒用設定過，進而呼叫addToVariablesToRemove將當前FastThreadLocal設定到InternalThrealLocal陣列下標為1的Set中
- 如果當前index大於等於陣列長度，相當於出現了hash衝突，這時候不會進行拉鍊，也不會進行線性探測，而是擴容，擴容邏輯如下
  
  首先是擴容到最接近當前index且大於index的2次冪大小（和hashMap一個道理）然後進行Arrays#copy實現陣列拷貝，並儲存當前值
  
  這裡可以看出FastThreadLocal快在哪裡，設定值的時候使用擴容來解決hash衝突，雖然導致了一些空間的浪費，但是這也使得get的時候可以根據index直接獲取資料，避免了線性探測的定址，從而有更高的效能！
3.4 remove

remove分為兩步，一是從InternalThreadLocalMap中移除index對應的元素，然後從InternalThreadLocal下標為0的Set中刪除

3.5 removeAll

FastThreadLocalRunnable在run方法指向完後自動指向此方法，即刪除當前執行緒所有的FastThreadLocal內容，避免記憶體漏失

四丶總結與思考

1.FastThreadLocal快在哪裡

空間換時間，ThreadLocal慢線上性探測，那麼直接通過更大陣列空間的開闢，避免線性探測，這是一種空間換時間的思想

2. FastThreadLocal為什麼不使用弱參照

追求極致的效能，使用弱參照帶來如下缺點
- GC開銷：弱參照需要GC垃圾收集器額外的工作來確定何時回收物件，netty這種對效能敏感的網路框架，頻繁的gc帶來不可預測的延遲
- 存取速度：使用弱參照可以讓Entry中key被回收，但是value還是存在，因此ThreadLocal會在get，set，等方法中檢測key為null的元素進行刪除，這也會帶來一定的開銷
- 顯示控制：上面我們看到，FastThreadLocalThread會將runnable進行包裝保證最後進行釋放，一定程度上保證
3.如何讓FastThreadLocal記憶體漏失 doge

結合FastThreadLocal的原理，我們只要我不顯示釋放，也不讓Runnable保證為FastThreadLocalRunnable，那麼就不會被釋放

如上這個例子，會持續輸出 "洩露啦"，但是如果使用ThreadLocal，再下次使用ThreadLocal的get，set方法的時候就會自動進行清理！

Netty原始碼學習8——從ThreadLocal到FastThreadLocal(如何讓FastThreadLocal記憶體漏失doge)

一丶引入

二丶從ThreadLocal說起

1.ThreadLocal基本結構

2.4 使用線性探測法，而不是拉鍊法

三丶FastThreadLocal 原始碼淺析

1.FastThreadLocal最佳實踐

2.FastThreadLocalThread

3.InternalThreadLocalMap

3.2 initialize

3.3 set

3.3.1 setKnownNotUnset

3.4 remove

3.5 removeAll

四丶總結與思考

1.FastThreadLocal快在哪裡

2. FastThreadLocal為什麼不使用弱參照

3.如何讓FastThreadLocal記憶體漏失 doge