推薦學習:
LRU,最近最少使用(Least Recently Used,LRU),經典快取演演算法。
LRU會使用一個連結串列維護快取中每個資料的存取情況,並根據資料的實時存取,調整資料在連結串列中的位置,然後通過資料在連結串列中的位置,表示資料是最近剛存取的,還是已有段時間未存取。
LRU會把鏈頭、尾分別設為MRU端和LRU端:
LRU可分成如下情況:
case2圖解:連結串列長度為5,從連結串列頭部到尾部儲存的資料分別是5,33,9,10,8。假設資料9被存取一次,則9就會被移動到連結串列頭部,同時,資料5和33都要向連結串列尾部移動一位。
所以若嚴格按LRU實現,假設Redis儲存的資料較多,還要在程式碼中實現:
為Redis使用最大記憶體時,可容納的所有資料維護一個連結串列
需額外記憶體空間來儲存連結串列
每當有新資料插入或現有資料被再次存取,需執行多次連結串列操作
在存取資料的過程中,讓Redis受到資料移動和連結串列操作的開銷影響
最終導致降低Redis存取效能。
所以,無論是為節省記憶體 or 保持Redis高效能,Redis並未嚴格按LRU基本原理實現,而是提供了一個近似LRU演演算法實現。
Redis的記憶體淘汰機制是如何啟用近似LRU演演算法的?redis.conf中的如下設定引數:
maxmemory,設定Redis server可使用的最大記憶體容量,一旦server使用實際記憶體量超出該閾值,server會根據maxmemory-policy設定策略,執行記憶體淘汰操作
maxmemory-policy,設定Redis server記憶體淘汰策略,包括近似LRU、LFU、按TTL值淘汰和隨機淘汰等
所以,一旦設定maxmemory選項,且將maxmemory-policy配為allkeys-lru或volatile-lru,近似LRU就被啟用。allkeys-lru和volatile-lru都會使用近似LRU淘汰資料,區別在於:
Redis如何實現近似LRU演演算法的呢?
全域性LRU時鐘值的計算
如何計算全域性LRU時鐘值的,以用來判斷資料存取的時效性
鍵值對LRU時鐘值的初始化與更新
哪些函數中對每個鍵值對對應的LRU時鐘值,進行初始化與更新
近似LRU演演算法的實際執行
如何執行近似LRU演演算法,即何時觸發資料淘汰,以及實際淘汰的機制實現
近似LRU演演算法仍需區分不同資料的存取時效性,即Redis需知道資料的最近一次存取時間。因此,有了LRU時鐘:記錄資料每次存取的時間戳。
Redis對每個KV對中的V,會使用個redisObject結構體儲存指向V的指標。那redisObject除記錄值的指標,還會使用24 bits儲存LRU時鐘資訊,對應的是lru成員變數。這樣,每個KV對都會把它最近一次被存取的時間戳,記錄在lru變數。
redisObject定義包含lru成員變數的定義:
每個KV對的LRU時鐘值是如何計算的?Redis Server使用一個範例級別的全域性LRU時鐘,每個KV對的LRU time會根據全域性LRU時鐘進行設定。
這全域性LRU時鐘儲存在Redis全域性變數server的成員變數lruclock
當Redis Server啟動後,呼叫initServerConfig初始化各項引數時,會呼叫getLRUClock設定lruclock的值:
於是,就得注意,**若一個資料前後兩次存取的時間間隔<1s,那這兩次存取的時間戳就是一樣的!**因為LRU時鐘精度就是1s,它無法區分間隔小於1秒的不同時間戳!
getLRUClock函數將獲得的UNIX時間戳,除以LRU_CLOCK_RESOLUTION後,就得到了以LRU時鐘精度來計算的UNIX時間戳,也就是當前的LRU時鐘值。
getLRUClock會把LRU時鐘值和宏定義LRU_CLOCK_MAX(LRU時鐘能表示的最大值)做與運算。
所以預設情況下,全域性LRU時鐘值是以1s為精度計算得UNIX時間戳,且是在initServerConfig中進行的初始化。
那Redis Server執行過程中,全域性LRU時鐘值是如何更新的?和Redis Server在事件驅動框架中,定期執行的時間事件所對應的serverCron有關。
serverCron作為時間事件的回撥函數,本身會週期性執行,其頻率值由redis.conf的hz設定項決定,預設值10,即serverCron函數會每100ms(1s/10 = 100ms)執行一次。serverCron中,全域性LRU時鐘值就會按該函數執行頻率,定期呼叫getLRUClock進行更新:
這樣,每個KV對就能從全域性LRU時鐘獲取最新存取時間戳。
對於每個KV對,它對應的redisObject.lru在哪些函數進行初始化和更新的呢?
對於一個KV對,其LRU時鐘值最初是在這KV對被建立時,進行初始化設定的,這初始化操作在createObject函數中呼叫,當Redis要建立一個KV對,就會呼叫該函數。
createObject除了會給redisObject分配記憶體空間,還會根據maxmemory_policy設定,初始化設定redisObject.lru。
LRU_CLOCK返回當前全域性LRU時鐘值。因為一個KV對一旦被建立,就相當於有了次存取,其對應LRU時鐘值就表示了它的存取時間戳:
那一個KV對的LRU時鐘值又是何時再被更新?
只要一個KV對被存取,其LRU時鐘值就會被更新!而當一個KV對被存取時,存取操作最終都會呼叫lookupKey。
lookupKey會從全域性雜湊表中查詢要存取的KV對。若該KV對存在,則lookupKey會根據maxmemory_policy的設定值,來更新鍵值對的LRU時鐘值,也就是它的存取時間戳。
而當maxmemory_policy沒有設定為LFU策略時,lookupKey函數就會呼叫LRU_CLOCK函數,來獲取當前的全域性LRU時鐘值,並將其賦值給鍵值對的redisObject結構體中的lru變數
這樣,每個KV對一旦被存取,就能獲得最新的存取時間戳。但你可能好奇:這些存取時間戳最終是如何被用於近似LRU演演算法進行資料淘汰的?
Redis之所以實現近似LRU,是為減少記憶體資源和操作時間上的開銷。
近似LRU主要邏輯在performEvictions。
performEvictions被evictionTimeProc呼叫,而evictionTimeProc函數又是被processCommand呼叫。
processCommand,Redis處理每個命令時都會呼叫:
然後,isSafeToPerformEvictions還會再次根據如下條件判斷是否繼續執行performEvictions:
一旦performEvictions被呼叫,且maxmemory-policy被設定為allkeys-lru或volatile-lru,近似LRU就被觸發執行了。
執行可分成如下步驟:
呼叫getMaxmemoryState評估當前記憶體使用情況,判斷當前Redis Server使用記憶體容量是否超過maxmemory設定值。
若未超過maxmemory,則返回C_OK,performEvictions也會直接返回。
getMaxmemoryState評估當前記憶體使用情況的時候,若發現已用記憶體超出maxmemory,會計算需釋放的記憶體量。這個釋放記憶體大小=已使用記憶體量-maxmemory。
但已使用記憶體量並不包括用於主從複製的複製緩衝區大小,這是getMaxmemoryState通過呼叫freeMemoryGetNotCountedMemory計算的。
而若當前Server使用的記憶體量超出maxmemory上限,則performEvictions會執行while迴圈淘汰資料釋放記憶體。
為淘汰資料,Redis定義陣列EvictionPoolLRU,儲存待淘汰的候選KV對,元素型別是evictionPoolEntry結構體,儲存了待淘汰KV對的空閒時間idle、對應K等資訊:
這樣,Redis Server在執行initSever進行初始化時,會呼叫evictionPoolAlloc為EvictionPoolLRU陣列分配記憶體空間,該陣列大小由EVPOOL_SIZE決定,預設可儲存16個待淘汰的候選KV對。
performEvictions在淘汰資料的迴圈流程中,就會更新這個待淘汰的候選KV對集合,即EvictionPoolLRU陣列。
performEvictions呼叫evictionPoolPopulate,其會先呼叫dictGetSomeKeys,從待取樣雜湊表隨機獲取一定數量K:
於是,dictGetSomeKeys返回取樣的KV對集合。evictionPoolPopulate根據實際取樣到的KV對數量count,執行迴圈:呼叫estimateObjectIdleTime計算在取樣集合中的每一個KV對的空閒時間:
接著,evictionPoolPopulate遍歷待淘汰的候選KV對集合,即EvictionPoolLRU陣列,嘗試把取樣的每個KV對插入EvictionPoolLRU陣列,取決於如下條件之一:
有一成立,evictionPoolPopulate就能把取樣KV對插入EvictionPoolLRU陣列。等所有取樣鍵值對都處理完後,evictionPoolPopulate函數就完成對待淘汰候選鍵值對集合的更新了。
接下來,performEvictions開始選擇最終被淘汰的KV對。
因evictionPoolPopulate已更新EvictionPoolLRU陣列,且該陣列裡的K,是按空閒時間從小到大排好序了。所以,performEvictions遍歷一次EvictionPoolLRU陣列,從陣列的最後一個K開始選擇,若選到的K非空,就把它作為最終淘汰的K。
該過程執行邏輯:
一旦選到被淘汰的K,performEvictions就會根據Redis server的惰性刪除設定,執行同步刪除或非同步刪除:
至此,performEvictions就淘汰了一個K。若此時釋放的記憶體空間還不夠,即沒有達到待釋放空間,則performEvictions還會重複執行前面所說的更新待淘汰候選KV對集合、選擇最終淘汰K的過程,直到滿足待釋放空間的大小要求。
performEvictions流程:
近似LRU演演算法並未使用耗時且耗空間的連結串列,而使用固定大小的待淘汰資料集合,每次隨機選擇一些K加入待淘汰資料集合。
最後,按待淘汰集合中K的空閒時間長度,刪除空閒時間最長的K。
根據LRU演演算法的基本原理,發現若嚴格按基本原理實現LRU演演算法,則開發的系統就需要額外記憶體空間儲存LRU連結串列,系統執行時也會受到LRU連結串列操作的開銷影響。
而Redis的記憶體資源和效能都很重要,所以Redis實現近似LRU演演算法:
一個演演算法的基本原理和演演算法的實際執行,在系統開發中會有一定折中,需綜合考慮所開發的系統,在資源和效能方面的要求,以避免嚴格按照演演算法實現帶來的資源和效能開銷。
推薦學習:
以上就是完全掌握Redis的LRU快取淘汰演演算法實現的詳細內容,更多請關注TW511.COM其它相關文章!