時間輪(TimeWheel)作為一種高效率的計時器實現方案,在1987年發表的論文Hashed and Hierarchical Timing Wheels中被首次提出。
其被髮明的主要目的在於解決當時作業系統的計時器功能實現中,維護一個定時器的開銷隨著所維護定時器數量的增多而逐漸變大的問題(時間複雜度為:O(n)、O(log n))。
這導致作業系統無法同時高效的維護大量計時器,進一步導致一些優秀的、需要使用到大量定時器的的網路協定、實時控制系統等程式的實際表現不盡人意。
計時器作為一種普遍的需求,理解起來是很簡單的。計時器主要由兩部分組成,即使用者指定一個任務(task),並在等待指定的時間(delayTime)後task將會被回撥執行。
在時間輪演演算法被髮明出來之前,作業系統計時器功能的實現方式主要可以分為兩種:基於無序佇列和基於有序佇列。
可以看到,在基於佇列的計時器模組執行時,最關鍵的兩個功能(建立新計時器/處理每次tick)至少有一個會隨著總計時器數量的增大,而引起效能大幅度的下降。
juc中自帶的ScheduledThreadPoolExecutor排程執行緒池就是基於有序列表(二元堆積)的計時器。因此netty等需要大量使用計時器的框架需要另闢蹊徑,採用時間輪來實現更高效的計時器功能。
對基礎資料結構有一定了解的讀者會知道,常用的快速排序、歸併排序等基於比較的高效排序演演算法其時間複雜度為O(n*log n)。
而基數排序(桶排序)的時間複雜度則是O(n),其效能比上述基於比較的排序演演算法高出一個數量級。
但基排序最大的缺陷則是對所要排序的資料集的排布有很高的要求,如果要排序的資料集的範圍非常廣,則所需要的桶(bucket)會非常多,空間複雜度會高到不可忍受。
舉個例子,如果是對1萬副撲克(不算大小王,52張牌)進行排序,由於撲克牌只有13種可能(A-K),即使1萬副撲克中牌的總數為52萬張,基排序只需要13個桶就能線上性時間複雜度O(n)內完成排序。
但如果是對資料範圍為0-1億範圍內的1萬個亂數進行一次基排序,則基排序需要多達1億個桶,其空間效率非常低,遠遜於快速排序等基於比較的排序。
截止目前,我們已經明確了兩個關鍵點:
一般來說,一次時鐘硬體的tick間隔非常小(納秒級別),如果想要用類似基排序的思想,使用一個巨大的陣列來儲存不同過期時間的計時器,
在理論上是可行的,但空間效率卻低到無法在現有的記憶體硬體上實現(1納秒對應1個bucket)。
但如果能容忍時鐘排程的時間不是那麼精確,則可以極大減少所需要的bucket桶的數量。
舉個例子,1毫秒等於1百萬納秒,如果時鐘排程的精度不需要是納秒級別,而是毫秒級別,則同一毫秒內的所有計時器(第100納秒和第999999納秒超時的計時器)都可以放在同一個桶中,所需要的陣列空間減少了100萬倍!
時間輪演演算法就是基於這一特點產生的,即一定程度上舍棄排程時間的精確性,參考基排序的思路,實現在常數時間內建立新計時器,並同時在常數時間內完成時鐘tick的處理。
下面我們簡單的介紹一個基於時間輪的計時器的基本實現思路(還有很多可以優化的地方):
上面介紹的時間輪實現思路中繞過了一個很重要的問題,即在時間輪tick間隔確定的情況下,
雖然環形陣列能夠複用之前使用過的bucket槽,但bucket桶的數量似乎限制了時間輪所能支援的最大超時時間。
舉個例子,假設tick間隔為1毫秒,那麼僅僅是儲存距離當前時間1天(86400秒)後超時的任務就至少需要86400*1000個bucket,所佔用的空間無疑是巨大的。
而一般的定時器模組所要支援的最大超時時間一般也不止1天這麼短。
雖然進一步的減少精度(比如tick間隔改為100毫秒,或者1秒)似乎能解決這個問題,但事實上時間輪的論文中還提到了一些更優秀的實現方案,使得能同時兼顧精度和減少空間佔用。
第一種方式是引入輪次(round)的概念(論文中提到的方案6),即每一個bucket中的列表元素帶上一個round屬性。
假設一個時間輪的tick間隔為1秒,並且環形陣列有86400個bucket桶,那麼這個時間輪明面上可以支援的最大超時時間只有1天。而引入了輪次的概念後,則理論上可以支援的最大超時時間是沒有限制的。
舉個例子,假設有一個定時器任務的超時時間為2天10小時20分鐘30秒,那麼在建立新計時器任務時基於當前時間輪單輪次可以支援的最大超時時間(即一天)進行求餘,
可以得到10小時20分鐘30秒,根據餘數我們可以計算出當前任務應該被插入到哪個bucket槽的列表中。而超時時間/最大超時時間(1天)得到除法的結果就是round輪次,即round=2。
同時在每次tick處理當前時間指標所指向的列表時,不再簡單的將列表中的所有任務一併取出執行,而是對其進行遍歷。
可以看到,引入了round概念後,多輪次的時間輪兼顧了精度的同時,也能夠在有限、可控的空間內支援足夠大的超時時間。
論文中提到的另一種實現方案便是多層次時間輪(如論文題目所指Hashed and Hierarchical Timing Wheels)。
多層時間輪的靈感來自於我們日常生活中隨處可見的機械鐘錶。通常機械鐘錶有一個秒針(60秒),一個分針(60分鐘)和一個時針(12小時),其本質上相當於一個tick間隔為1秒,支援的最大超時時間為12小時的多層時間輪。
12小時有60 * 60 * 12=43200秒,但是鐘錶中實際上並沒有這麼多的bucket,卻也能準確的表達12小時中的任何一秒。
這是因為鐘錶中的秒針、分針和時針本質上相當於三個不同層次的時間輪:
在多層時間輪的實現中,可以建立N個不同層次的時間輪,其中上一層時間輪的tick間隔等於下一層時間輪走完一週的時間(類似1分鐘等於60秒,1小時等於60分鐘)。
如果時間輪的層次足夠多,理論上也能支援足夠大範圍的超時時間。
舉個例子,精度為秒的的時間輪,只需要5層共(60+60+24+365+100)=609個bucket就能支援最大100年的超時時間(假設一年都是365天)。
建立新計時器時,根據超時時間,先嚐試著放入最底層的時間輪,如果最底層的時間輪能放的下(比如第0分鐘58秒過期的),就根據當前時間輪的tick間隔做除法來計算出需要放入的具體bucket。
如果當前時間輪放不下(比如距離當前時間10分鐘20秒過期的,無法直接放入最大60秒的秒級時間輪,但能放到最大支援60分鐘的分鐘時間輪中),則嘗試著放到上一層的時間輪中,但是是基於上一層的時間輪的tick間隔來做除法來計算出具體要放入的bucket槽。
如果還是放不下(比如距離當前時間3小時20分鐘18秒過期的,只能放到最大12小時的小時級時間輪中)。
迴圈往復這一過程,直到放到合適層次的時間輪中。
多層次的時間輪中的基礎tick間隔是由最底層的時間輪決定的。
每次tick時會推動當前時間,首先將最底層的時間輪中新指向的插槽中的任務全部取出進行排程;
接著判斷當前時間輪是否走完了一整圈,如果是的話則推動上一層級的時間輪推進而指向新的bucket槽(比如秒級時間輪走完了60秒,則推進分針前進1格)。
被推動的上層時間輪需要將新指向的bucket槽中的任務全部取出,嘗試著放到下層時間輪中
(下一層或者下N層都有可能,比如超時時間為1小時10分鐘30秒的任務會在小時時間輪從0推進到1時放到分鐘時間輪裡,而超時時間為1小時0分鐘30秒的任務則會被直接放到最下層的秒鐘時間輪裡)。
層級時間輪的tick推動是從下層蔓延到上層的,每次tick可能都會推動1至N層時間輪(比如第0小時第59分鐘59秒->第1小時第0分鐘第0秒就推動了2層)。
上面介紹的時間輪實現方式是很粗略的,連虛擬碼都不算。要想真正理解時間輪的工作原理,最好的辦法還是通過參考已有實現,並自己親手實現一遍才會印象深刻。
在本篇部落格中將會結合原始碼介紹三種實現方式略有不同的時間輪,分別是:
為了便於讀者理解和閱讀原始碼,相比netty或kafka中的工程化的實現,部落格中實現的版本是簡化過的,其只聚焦於時間輪本身的工作原理,而捨棄掉了關於取消定時任務、優雅啟動/停止等相關的邏輯。
為了便於測試,所有的時間輪實現都實現了一個自定義的Timer介面
public interface Timer {
/**
* 啟動時間輪
* */
void startTimeWheel();
/**
* 建立新的超時任務(必須先startTimeWheel完成後,才能建立新任務)
* @param task 超時時需要排程的自定義任務
* @param delayTime 延遲時間
* @param timeUnit 延遲時間delayTime的單位
* */
void newTimeoutTask(Runnable task, long delayTime, TimeUnit timeUnit);
}
/**
* 參考netty實現的單層時間輪
* */
public class MyHashedTimeWheel implements Timer{
/**
* 環形陣列
* */
private final MyHashedTimeWheelBucket[] ringBucketArray;
/**
* 世間輪啟動時的具體時間戳(單位:納秒nanos)
* */
private long startTime;
/**
* 是否已啟動
* */
private final AtomicBoolean started = new AtomicBoolean(false);
/**
* 時間輪每次轉動的時間(單位:納秒nanos)
* (perTickTime越短,排程會更精確,但cpu開銷也會越大)
* */
private final long perTickTime;
/**
* 總tick數
* */
private long totalTick = 0;
/**
* 待處理任務的佇列
* (多外部生產者寫入,時間輪內的單worker消費者讀取,所以netty的實現裡使用了效率更高的MpscQueue,Mpsc即MultiProducerSingleConsumer)
* */
private final Queue<MyTimeoutTaskNode> unProcessTaskQueue = new LinkedBlockingDeque<>();
/**
* 用於實際執行到期任務的執行緒池
* */
private final Executor taskExecutor;
private Thread workerThread;
/**
* 建構函式
* */
public MyHashedTimeWheel(int ringArraySize, long perTickTime, Executor taskExecutor) {
this.ringBucketArray = new MyHashedTimeWheelBucket[ringArraySize];
for(int i=0; i<ringArraySize; i++){
// 初始化,填充滿時間輪喚醒陣列
this.ringBucketArray[i] = new MyHashedTimeWheelBucket();
}
this.perTickTime = perTickTime;
this.taskExecutor = taskExecutor;
}
/**
* 啟動worker執行緒等初始化操作,必須執行完成後才能正常工作
* (簡單起見,和netty不一樣不是等任務被建立時才懶載入的,必須提前啟動)
* */
@Override
public void startTimeWheel(){
// 啟動worker執行緒
this.workerThread = new Thread(new Worker());
this.workerThread.start();
while (!this.started.get()){
// 自旋迴圈,等待一會
}
System.out.println("startTimeWheel 啟動完成:" + this.getClass().getSimpleName());
}
@Override
public void newTimeoutTask(Runnable task, long delayTime, TimeUnit timeUnit){
long deadline = System.nanoTime() + timeUnit.toNanos(delayTime);
// Guard against overflow.
if (delayTime > 0 && deadline < 0) {
deadline = Long.MAX_VALUE;
}
MyTimeoutTaskNode newTimeoutTaskNode = new MyTimeoutTaskNode();
newTimeoutTaskNode.setTargetTask(task);
newTimeoutTaskNode.setDeadline(deadline);
unProcessTaskQueue.add(newTimeoutTaskNode);
}
private final class Worker implements Runnable{
@Override
public void run() {
MyHashedTimeWheel.this.startTime = System.nanoTime();
// 啟動
MyHashedTimeWheel.this.started.set(true);
// 簡單起見,不考慮優雅啟動和暫停的邏輯
while (true){
// 等待perTick
waitForNextTick();
// 在撈取當前tick下需要處理的bucket前,先將加入到佇列中的任務轉移到環形陣列中(可能包含在當前tick下就要處理的任務)
transferTaskToBuckets();
// 基於總tick數,對環形陣列的長度取模,計算出當前tick下需要處理的bucket桶的下標
int idx = (int) (MyHashedTimeWheel.this.totalTick % MyHashedTimeWheel.this.ringBucketArray.length);
MyHashedTimeWheelBucket bucket = MyHashedTimeWheel.this.ringBucketArray[idx];
// 處理當前插槽內的任務(遍歷連結串列中的所有任務,round全部減一,如果減為負數了則說明這個任務超時到期了,將其從連結串列中移除後並交給執行緒池執行指定的任務)
bucket.expireTimeoutTask(MyHashedTimeWheel.this.taskExecutor);
// 迴圈tick一次,總tick數自增1
MyHashedTimeWheel.this.totalTick++;
}
}
/**
* per tick時鐘跳動,基於Thread.sleep
* */
private void waitForNextTick(){
// 由於Thread.sleep並不是絕對精確的被喚醒,所以只能通過(('總的tick數+1' * '每次tick的間隔') + '時間輪啟動時間')來計算精確的下一次tick時間
// 而不能簡單的Thread.sleep(每次tick的間隔)
long nextTickTime = (MyHashedTimeWheel.this.totalTick + 1) * MyHashedTimeWheel.this.perTickTime
+ MyHashedTimeWheel.this.startTime;
// 因為nextTickTime是納秒,sleep需要的是毫秒,需要保證納秒數過小時,導致直接計算出來的毫秒數為0
// 因此(‘實際休眠的納秒數’+999999)/1000000,保證了納秒轉毫秒時,至少會是1毫秒,而不會出現sleep(0毫秒)令cpu空轉
long needSleepTime = (nextTickTime - System.nanoTime() + 999999) / 1000000;
try {
// 比起netty,忽略了一些處理特殊場景bug的邏輯
Thread.sleep(needSleepTime);
} catch (InterruptedException ignored) {
}
}
private void transferTaskToBuckets() {
// 為了避免worker執行緒在一次迴圈中處理太多的任務,所以直接限制了一個最大值100000
// 如果真的有這麼多,就等到下次tick迴圈的時候再去做。
// 因為這個操作是cpu密集型的,處理太多的話,可能導致無法在一個短的tick週期內完成一次迴圈
for (int i = 0; i < 100000; i++) {
MyTimeoutTaskNode timeoutTaskNode = MyHashedTimeWheel.this.unProcessTaskQueue.poll();
if (timeoutTaskNode == null) {
// 佇列為空了,直接結束
return;
}
// 計算到任務超時時,應該執行多少次tick
// (和netty裡的不一樣,這裡的deadline是超時時間的絕對時間,所以需要先減去時間輪的startTime)
// (netty中是生產者執行緒在add時事先減去了startTime,比起由worker執行緒統一處理效率更高,但個人覺得這裡的寫法會更直觀)
long totalTickWhenTimeout = (timeoutTaskNode.getDeadline() - MyHashedTimeWheel.this.startTime) / MyHashedTimeWheel.this.perTickTime;
// 減去當前時間輪已經進行過的tick數量
long remainingTickWhenTimeout = (totalTickWhenTimeout - MyHashedTimeWheel.this.totalTick);
// 因為一次時間輪旋轉會經過ringBucketArray.length次tick,所以求個餘數
long remainingRounds = remainingTickWhenTimeout / MyHashedTimeWheel.this.ringBucketArray.length;
// 計算出當前任務需要轉多少圈之後才會超時
timeoutTaskNode.setRounds(remainingRounds);
// 如果傳入的deadline早於當前系統時間,則totalTickWhenTimeout可能會小於當前的totalTick
// 這種情況下,讓這個任務在當前tick下就立即超時而被排程是最合理的,而不能在求餘後放到一個錯誤的位置而等一段時間才排程(所以必須取兩者的最大值)
final long ticks = Math.max(totalTickWhenTimeout, MyHashedTimeWheel.this.totalTick); // Ensure we don't schedule for past.
// 如果能限制環形陣列的長度為2的冪,則可以改為ticks & mask,位運算效率更高
int stopIndex = (int) (ticks % MyHashedTimeWheel.this.ringBucketArray.length);
MyHashedTimeWheelBucket bucket = MyHashedTimeWheel.this.ringBucketArray[stopIndex];
// 計算並找到應該被放置的那個bucket後,將其插入當前bucket指向的連結串列中
bucket.addTimeout(timeoutTaskNode);
}
}
}
}
/**
* 時間輪環形陣列下標對應的桶(儲存一個超時任務MyTimeoutTaskNode的連結串列)
* */
public class MyHashedTimeWheelBucket {
private final LinkedList<MyTimeoutTaskNode> linkedList = new LinkedList<>();
public void addTimeout(MyTimeoutTaskNode timeout) {
linkedList.add(timeout);
}
/**
* 遍歷連結串列中的所有任務,round全部減一,如果減為負數了則說明這個任務超時到期了,將其從連結串列中移除後並交給執行緒池執行指定的任務
* */
public void expireTimeoutTask(Executor executor){
Iterator<MyTimeoutTaskNode> iterator = linkedList.iterator();
while(iterator.hasNext()){
MyTimeoutTaskNode currentNode = iterator.next();
long currentNodeRound = currentNode.getRounds();
if(currentNodeRound <= 0){
// 將其從連結串列中移除
iterator.remove();
// count小於等於0,說明超時了,交給執行緒池去非同步執行
executor.execute(currentNode.getTargetTask());
}else{
// 當前節點還未超時,round自減1
currentNode.setRounds(currentNodeRound-1);
}
// 簡單起見,不考慮任務被外部自己取消的case(netty裡的timeout.isCancelled())
}
}
}
public class MyTimeoutTaskNode {
/**
* 任務具體的到期時間(絕對時間)
* */
private long deadline;
/**
* 儲存在時間輪中,需要等待的輪次
* (rounds在初始化後,每次時間輪轉動一週便自減1,當減為0時便代表當前任務需要被排程)
* */
private long rounds;
/**
* 建立任務時,使用者指定的到期時進行排程的任務
* */
private Runnable targetTask;
public long getDeadline() {
return deadline;
}
public void setDeadline(long deadline) {
this.deadline = deadline;
}
public long getRounds() {
return rounds;
}
public void setRounds(long rounds) {
this.rounds = rounds;
}
public Runnable getTargetTask() {
return targetTask;
}
public void setTargetTask(Runnable targetTask) {
this.targetTask = targetTask;
}
}
層次時間輪MyHierarchicalHashedTimerV1的主體邏輯與單層多輪次時間輪MyHashedTimeWheel基本保持一致,主要的區別有幾點:
/**
* 層次時間輪,會存在空轉問題
* */
public class MyHierarchicalHashedTimerV1 implements Timer {
/**
* 是否已啟動
* */
private AtomicBoolean started = new AtomicBoolean(false);
/**
* 世間輪啟動時的具體時間戳(單位:納秒nanos)
* */
private long startTime;
/**
* 時間輪每次轉動的時間(單位:納秒nanos)
* (perTickTime越短,排程會更精確,但cpu開銷也會越大)
* */
private final long perTickTime;
/**
* 總tick數
* */
private long totalTick = 0;
/**
* 待處理任務的佇列
* (多外部生產者寫入,時間輪內的單worker消費者讀取,所以netty的實現裡使用了效率更高的MpscQueue,Mpsc即MultiProducerSingleConsumer)
* */
private final Queue<MyTimeoutTaskNode> unProcessTaskQueue = new LinkedBlockingDeque<>();
/**
* timer持有的最低層的時間輪
* */
private final MyHierarchicalHashedTimeWheelV1 lowestTimeWheel;
/**
* 建構函式
* */
public MyHierarchicalHashedTimerV1(int ringArraySize, long perTickTime, Executor taskExecutor) {
this.perTickTime = perTickTime;
// 初始化最底層的時間輪
this.lowestTimeWheel = new MyHierarchicalHashedTimeWheelV1(ringArraySize,perTickTime,taskExecutor,0);
}
/**
* 啟動worker執行緒等初始化操作,必須執行完成後才能正常工作
* (簡單起見,和netty不一樣不是等任務被建立時才懶載入的,必須提前啟動)
* */
@Override
public void startTimeWheel(){
// 啟動worker執行緒
new Thread(new Worker()).start();
while (!this.started.get()){
// 自旋迴圈,等待一會
}
System.out.println("startTimeWheel 啟動完成:" + this.getClass().getSimpleName());
}
@Override
public void newTimeoutTask(Runnable task, long delayTime, TimeUnit timeUnit){
long deadline = System.nanoTime() + timeUnit.toNanos(delayTime);
// Guard against overflow.
if (delayTime > 0 && deadline < 0) {
deadline = Long.MAX_VALUE;
}
MyTimeoutTaskNode newTimeoutTaskNode = new MyTimeoutTaskNode();
newTimeoutTaskNode.setTargetTask(task);
newTimeoutTaskNode.setDeadline(deadline);
this.unProcessTaskQueue.add(newTimeoutTaskNode);
}
private final class Worker implements Runnable{
@Override
public void run() {
MyHierarchicalHashedTimerV1.this.startTime = System.nanoTime();
// 啟動
MyHierarchicalHashedTimerV1.this.started.set(true);
// 簡單起見,不考慮優雅啟動和暫停的邏輯
while (true){
// 等待perTick
waitForNextTick();
// 在撈取當前tick下需要處理的bucket前,先將加入到佇列中的任務轉移到時間輪中(可能包含在當前tick下就要處理的任務)
// 層級時間輪內部會做進一步的分配(放不下的話就溢位到更上一層的時間輪)
transferTaskToTimeWheel();
// 推進時間輪(層級時間輪內部滿了一圈就會進一步的推進更上一層的時間輪)
MyHierarchicalHashedTimerV1.this.lowestTimeWheel.advanceClockByTick(
(taskNode)->
// 參考kafka的寫法,避免Timer裡的一些屬性被傳到各個bucket裡面
MyHierarchicalHashedTimerV1.this.lowestTimeWheel
.addTimeoutTask(MyHierarchicalHashedTimerV1.this.startTime, taskNode)
);
// 迴圈tick一次,總tick數自增1
MyHierarchicalHashedTimerV1.this.totalTick++;
}
}
/**
* per tick時鐘跳動,基於Thread.sleep
* */
private void waitForNextTick(){
// 由於Thread.sleep並不是絕對精確的被喚醒,所以只能通過(('總的tick數+1' * '每次tick的間隔') + '時間輪啟動時間')來計算精確的下一次tick時間
// 而不能簡單的Thread.sleep(每次tick的間隔)
long nextTickTime = (MyHierarchicalHashedTimerV1.this.totalTick + 1) * MyHierarchicalHashedTimerV1.this.perTickTime
+ MyHierarchicalHashedTimerV1.this.startTime;
// 因為nextTickTime是納秒,sleep需要的是毫秒,需要保證納秒數過小時,導致直接計算出來的毫秒數為0
// 因此(‘實際休眠的納秒數’+999999)/1000000,保證了納秒轉毫秒時,至少會是1毫秒,而不會出現sleep(0毫秒)令cpu空轉
long needSleepTime = (nextTickTime - System.nanoTime() + 999999) / 1000000;
try {
// 比起netty,忽略了一些處理特殊場景bug的邏輯
Thread.sleep(needSleepTime);
} catch (InterruptedException ignored) {
}
}
/**
* 加入到佇列中的任務轉移到時間輪中
* */
private void transferTaskToTimeWheel() {
// 為了避免worker執行緒在一次迴圈中處理太多的任務,所以直接限制了一個最大值100000
// 如果真的有這麼多,就等到下次tick迴圈的時候再去做。
// 因為這個操作是cpu密集型的,處理太多的話,可能導致無法在一個短的tick週期內完成一次迴圈
for (int i = 0; i < 100000; i++) {
MyTimeoutTaskNode timeoutTaskNode = MyHierarchicalHashedTimerV1.this.unProcessTaskQueue.poll();
if (timeoutTaskNode == null) {
// 佇列為空了,直接結束
return;
}
// 層級時間輪內部會做進一步的分配(放不下的話就溢位到更上一層的時間輪)
MyHierarchicalHashedTimerV1.this.lowestTimeWheel.addTimeoutTask(
MyHierarchicalHashedTimerV1.this.startTime, timeoutTaskNode);
}
}
}
}
public class MyHierarchicalHashedTimeWheelV1 {
private final MyHierarchyHashedTimeWheelBucketV1[] ringBucketArray;
/**
* 總tick數
* */
private long totalTick = 0;
/**
* 當前時間輪所能承載的時間間隔
* */
private final long interval;
/**
* 時間輪每次轉動的時間(單位:納秒nanos)
* (perTickTime越短,排程會更精確,但cpu開銷也會越大)
* */
private final long perTickTime;
/**
* 上一層時間跨度更大的時間輪
* */
private MyHierarchicalHashedTimeWheelV1 overFlowWheel;
/**
* 用於實際執行到期任務的執行緒池
* */
private final Executor taskExecutor;
/**
* 是否是最底層的時間輪(只有最底層的時間輪才真正的對任務進行排程)
* */
private final int level;
public MyHierarchicalHashedTimeWheelV1(int ringArraySize,long perTickTime, Executor taskExecutor,int level) {
this.ringBucketArray = new MyHierarchyHashedTimeWheelBucketV1[ringArraySize];
for(int i=0; i<ringArraySize; i++){
// 初始化,填充滿時間輪喚醒陣列
this.ringBucketArray[i] = new MyHierarchyHashedTimeWheelBucketV1();
}
this.perTickTime = perTickTime;
this.taskExecutor = taskExecutor;
this.interval = perTickTime * ringArraySize;
this.level = level;
if(level > 0){
this.totalTick = 1;
}
}
/**
* 當前時間輪加入任務(溢位的話,則需要放到上一層的時間輪中)
* */
public void addTimeoutTask(long startTime, MyTimeoutTaskNode timeoutTaskNode){
long deadline = timeoutTaskNode.getDeadline();
// 當前時間輪所能承載的最大絕對時間為:每個tick的間隔 * 插槽數 + (基於startTime的當前絕對時間)
long currentWheelMaxRange = this.interval + (startTime + this.perTickTime * this.totalTick);
if(deadline < currentWheelMaxRange){
// 當前時間輪能夠承載這個任務,無需放到上一層時間輪中
// 計算到任務超時時,應該執行多少次tick
// (和netty裡的不一樣,這裡的deadline是超時時間的絕對時間,所以需要先減去時間輪的startTime)
// (netty中是生產者執行緒在add時事先減去了startTime,比起由worker執行緒統一處理效率更高,但個人覺得這裡的寫法會更直觀)
long totalTickWhenTimeout = (deadline - startTime) / this.perTickTime;
// 如果傳入的deadline早於當前系統時間,則totalTickWhenTimeout可能會小於當前的totalTick
// 這種情況下,讓這個任務在當前tick下就立即超時而被排程是最合理的,而不能在求餘後放到一個錯誤的位置而等一段時間才排程(所以必須取兩者的最大值)
final long ticks = Math.max(totalTickWhenTimeout, this.totalTick); // Ensure we don't schedule for past.
// 如果能限制環形陣列的長度為2的冪,則可以改為ticks & mask,位運算效率更高
int stopIndex = (int) (ticks % this.ringBucketArray.length);
MyHierarchyHashedTimeWheelBucketV1 bucket = this.ringBucketArray[stopIndex];
// 計算並找到應該被放置的那個bucket後,將其插入當前bucket指向的連結串列中
bucket.addTimeout(timeoutTaskNode);
}else{
// 當前時間輪無法承載這個任務,需要放到上一層時間輪中
// 上層時間輪不存在,建立之
if(this.overFlowWheel == null){
// 上層時間輪的環形陣列大小保持不變,perTick是當前時間輪的整個間隔(類似低層的60秒等於上一層的1分鐘)
this.overFlowWheel = new MyHierarchicalHashedTimeWheelV1(
this.ringBucketArray.length, this.interval, taskExecutor,this.level+1);
}
// 加入到上一層的時間輪中(對於較大的deadline,addTimeoutTask操作可能會遞迴數次,放到第N層的時間輪中)
this.overFlowWheel.addTimeoutTask(startTime,timeoutTaskNode);
}
}
public void advanceClockByTick(Consumer<MyTimeoutTaskNode> flushInLowerWheelFn){
// 基於總tick數,對環形陣列的長度取模,計算出當前tick下需要處理的bucket桶的下標
int idx = (int) (this.totalTick % this.ringBucketArray.length);
MyHierarchyHashedTimeWheelBucketV1 bucket = this.ringBucketArray[idx];
if(this.level == 0){
// 如果是最底層的時間輪,將當前tick下命中的bucket中的任務丟到taskExecutor中執行
bucket.expireTimeoutTask(this.taskExecutor);
}else{
// 如果不是最底層的時間輪,將當前tick下命中的bucket中的任務交給下一層的時間輪
// 這裡轉交到下一層有兩種方式:第一種是從上到下的轉交,另一種是當做新任務一樣還是從最下層的時間輪開始放,放不下再往上溢位
// 選用後一種邏輯,最大的複用已有的建立新任務的邏輯,會好理解一點
bucket.flush(flushInLowerWheelFn);
}
// 當前時間輪的總tick自增1
this.totalTick++;
// 當前時間輪的總tick數滿了一圈之後,推進上一層時間輪進行一次tick(如果上一層時間輪存在的話)
if(this.totalTick % this.ringBucketArray.length == 0 && this.overFlowWheel != null){
this.overFlowWheel.advanceClockByTick(flushInLowerWheelFn);
}
}
}
/**
* 時間輪環形陣列下標對應的桶(儲存一個超時任務MyTimeoutTaskNode的連結串列)
* */
public class MyHierarchyHashedTimeWheelBucketV1 {
private final LinkedList<MyTimeoutTaskNode> linkedList = new LinkedList<>();
public void addTimeout(MyTimeoutTaskNode timeout) {
linkedList.add(timeout);
}
/**
* 遍歷連結串列中的所有任務,round全部減一,如果減為負數了則說明這個任務超時到期了,將其從連結串列中移除後並交給執行緒池執行指定的任務
* */
public void expireTimeoutTask(Executor executor){
Iterator<MyTimeoutTaskNode> iterator = linkedList.iterator();
while(iterator.hasNext()){
MyTimeoutTaskNode currentNode = iterator.next();
long currentNodeRound = currentNode.getRounds();
if(currentNodeRound <= 0){
// 將其從連結串列中移除
iterator.remove();
// count小於等於0,說明超時了,交給執行緒池去非同步執行
executor.execute(currentNode.getTargetTask());
}else{
// 當前節點還未超時,round自減1
currentNode.setRounds(currentNodeRound-1);
}
// 簡單起見,不考慮任務被外部自己取消的case(netty裡的timeout.isCancelled())
}
}
/**
* 將當前bucket中的資料,通過flushInLowerWheelFn,全部轉移到更底層的時間輪中
* */
public void flush(Consumer<MyTimeoutTaskNode> flushInLowerWheelFn){
Iterator<MyTimeoutTaskNode> iterator = linkedList.iterator();
while(iterator.hasNext()){
MyTimeoutTaskNode currentNode = iterator.next();
// 先從連結串列中移除
iterator.remove();
// 通過flushInLowerWheelFn,轉移到更底層的時間輪中
flushInLowerWheelFn.accept(currentNode);
// 簡單起見,不考慮任務被外部自己取消的case(netty裡的timeout.isCancelled())
}
}
}
上面實現的單層多輪時間輪以及層次時間輪都存在一個問題,即時間輪論文中提到的空轉問題(step through an empty bucket)。
舉個例子,假設時間輪的tick間隔被設定為1秒,使用者建立了一個10秒後過期的任務和一個10小時後過期的任務。在處理完了第一個10秒後過期的任務後,剩下的幾萬次tick都由於每個時間輪當前時間指向的bucket是一個空列表而在做無用功。
生產環境中為了保證一定的排程精度,tick間隔一般會設定為毫秒級別甚至更低,那麼時間輪空轉對CPU的浪費就不是一個可以忽視的問題了。
在著名的訊息佇列kafka中就實現了一個能解決空轉問題的層次時間輪(Timer/TimingWheel),其解決時間輪空轉的方式是引入延遲佇列。
請注意:這裡的延遲佇列不是用於儲存計時器任務的,而是用來儲存bucket槽的(MyHierarchyHashedTimeWheelBucketV2)。
前面提到,時間輪插槽的數量是相對固定的,其遠遠少於計時器任務的數量,所以不會出現效能瓶頸。
MyHierarchicalHashedTimerV2由於引入了延遲佇列,所以在實現上相對複雜了一些。
public class MyHierarchicalHashedTimerV2 implements Timer {
/**
* 是否已啟動
* */
private AtomicBoolean started = new AtomicBoolean(false);
/**
* 關聯的最底層時間輪
* */
private volatile MyHierarchicalHashedTimeWheelV2 lowestTimeWheel;
/**
* 時間輪的啟動時間(單位:納秒)
* */
private long startTime;
/**
* 每次tick的間隔(單位:納秒)
* */
private final long perTickTime;
/**
* 時間輪的大小
* */
private final int timeWheelSize;
/**
* 用於實際執行到期任務的執行緒池
* */
private final Executor taskExecutor;
/**
* 用於儲存bucket元素的延遲佇列,用於解決時間輪空轉的問題
* */
private final DelayQueue<MyHierarchyHashedTimeWheelBucketV2> bucketDelayQueue = new DelayQueue<>();
public MyHierarchicalHashedTimerV2(int timeWheelSize,long perTickTime, Executor taskExecutor) {
this.timeWheelSize = timeWheelSize;
this.perTickTime = perTickTime;
this.taskExecutor = taskExecutor;
}
/**
* 啟動worker執行緒等初始化操作,必須執行完成後才能正常工作
* (簡單起見,和netty不一樣不是等任務被建立時才懶載入的,必須提前啟動)
* */
@Override
public void startTimeWheel(){
// 啟動worker執行緒
new Thread(new Worker()).start();
while (!this.started.get()){
// 自旋迴圈,等待一會
}
System.out.println("startTimeWheel 啟動完成:" + this.getClass().getSimpleName());
}
@Override
public void newTimeoutTask(Runnable task, long delayTime, TimeUnit timeUnit){
long deadline = System.nanoTime() + timeUnit.toNanos(delayTime);
// Guard against overflow.
if (delayTime > 0 && deadline < 0) {
deadline = Long.MAX_VALUE;
}
MyTimeoutTaskNode newTimeoutTaskNode = new MyTimeoutTaskNode();
newTimeoutTaskNode.setTargetTask(task);
newTimeoutTaskNode.setDeadline(deadline);
// 加入到最底層的時間輪中,當前時間輪放不下的會溢位都上一層時間輪
this.lowestTimeWheel.addTimeoutTask(newTimeoutTaskNode);
}
private void advanceClock(){
try {
MyHierarchyHashedTimeWheelBucketV2 bucket = this.bucketDelayQueue.take();
lowestTimeWheel.advanceClockByTick(bucket.getExpiration());
bucket.flush((node)->{
// 當前選中的bucket中的任務,重新插入到時間輪中
// 1 原本處於高層的bucket中的任務會被放到更底層
// 2 原本就處於最低一層的bucket中的任務會被直接執行
this.lowestTimeWheel.addTimeoutTask(node);
});
// 將當前時間輪的資料
} catch (Exception e) {
// 忽略掉異常
e.printStackTrace();
}
}
private final class Worker implements Runnable {
@Override
public void run() {
MyHierarchicalHashedTimerV2.this.startTime = System.nanoTime();
// 初始化最底層的時間輪
MyHierarchicalHashedTimerV2.this.lowestTimeWheel = new MyHierarchicalHashedTimeWheelV2(
MyHierarchicalHashedTimerV2.this.startTime,
MyHierarchicalHashedTimerV2.this.perTickTime,
MyHierarchicalHashedTimerV2.this.timeWheelSize,
MyHierarchicalHashedTimerV2.this.taskExecutor,
MyHierarchicalHashedTimerV2.this.bucketDelayQueue
);
// 啟動
MyHierarchicalHashedTimerV2.this.started.set(true);
while (true){
// 一直無限迴圈,不斷推進時間
advanceClock();
}
}
}
}
public class MyHierarchicalHashedTimeWheelV2 {
/**
* 上層時間輪(生產者/消費者都會存取到,volatile修飾)
* */
private volatile MyHierarchicalHashedTimeWheelV2 overflowTimeWheel;
/**
* 每次tick的間隔(單位:納秒)
* */
private final long perTickTime;
/**
* 時間輪環形陣列
* */
private final MyHierarchyHashedTimeWheelBucketV2[] ringBucketArray;
/**
* 用於實際執行到期任務的執行緒池
* */
private final Executor taskExecutor;
/**
* 時間輪的當前時間
* */
private long currentTime;
/**
* 當前時間輪的間隔(每次tick的時間 * 時間輪的大小)
* */
private final long interval;
private final DelayQueue<MyHierarchyHashedTimeWheelBucketV2> bucketDelayQueue;
public MyHierarchicalHashedTimeWheelV2(long startTime, long perTickTime, int wheelSize, Executor taskExecutor,
DelayQueue<MyHierarchyHashedTimeWheelBucketV2> bucketDelayQueue) {
// 初始化環形陣列
this.ringBucketArray = new MyHierarchyHashedTimeWheelBucketV2[wheelSize];
for(int i=0; i<wheelSize; i++){
this.ringBucketArray[i] = new MyHierarchyHashedTimeWheelBucketV2();
}
// 初始化時,當前時間為startTime
this.currentTime = startTime - (startTime % perTickTime);
this.perTickTime = perTickTime;
this.taskExecutor = taskExecutor;
this.interval = perTickTime * wheelSize;
this.bucketDelayQueue = bucketDelayQueue;
}
public void addTimeoutTask(MyTimeoutTaskNode timeoutTaskNode) {
long deadline = timeoutTaskNode.getDeadline();
if(deadline < this.currentTime + this.perTickTime){
// 超時時間小於1tick,直接執行
this.taskExecutor.execute(timeoutTaskNode.getTargetTask());
}else if(deadline < this.currentTime + this.interval){
// 當前時間輪放的下
// 在超時時,理論上總共需要的tick數
long totalTick = deadline / this.perTickTime;
// 如果傳入的deadline早於當前系統時間,則totalTickWhenTimeout可能會小於當前的totalTick
// 這種情況下,讓這個任務在當前tick下就立即超時而被排程是最合理的,而不能在求餘後放到一個錯誤的位置而等一段時間才排程(所以必須取兩者的最大值)
// 如果能限制環形陣列的長度為2的冪,則可以改為ticks & mask,位運算效率更高
int stopIndex = (int) (totalTick % this.ringBucketArray.length);
MyHierarchyHashedTimeWheelBucketV2 bucket = this.ringBucketArray[stopIndex];
// 計算並找到應該被放置的那個bucket後,將其插入當前bucket指向的連結串列中
bucket.addTimeout(timeoutTaskNode);
// deadline先除以this.perTickTime再乘以this.perTickTime,可以保證放在同一個插槽下的任務,expiration都是一樣的
long expiration = totalTick * this.perTickTime;
boolean isNewRound = bucket.setExpiration(expiration);
if(isNewRound){
this.bucketDelayQueue.offer(bucket);
}
}else{
// 當前時間輪放不下
if(this.overflowTimeWheel == null){
createOverflowWheel();
}
// 加入到上層的時間輪中(較大的deadline會遞迴多次)
this.overflowTimeWheel.addTimeoutTask(timeoutTaskNode);
}
}
/**
* 推進當前時間輪的時鐘
* 舉個例子:假設當前時間輪的當前時間是第10分鐘,perTickTime是1分鐘,
* 1.如果expiration是第10分鐘第1秒,則不用推動當前時間
* 2.如果expiration是第11分鐘第0秒,則需要推動當前時間
* */
public void advanceClockByTick(long expiration){
// 只會在tick推進時才會被呼叫,引數expiration可以認為是當前時間輪的系統時間
if(expiration >= this.currentTime + this.perTickTime){
// 超過了1tick,則需要推進當前時間輪 (始終保持當前時間是perTickTime的整數倍,邏輯上的totalTick)
this.currentTime = expiration - (expiration % this.perTickTime);
if(this.overflowTimeWheel != null){
// 如果上層時間輪存在,則遞迴的繼續推進
this.overflowTimeWheel.advanceClockByTick(expiration);
}
}
}
private synchronized void createOverflowWheel(){
if(this.overflowTimeWheel == null){
// 建立上層時間輪,上層時間輪的perTickTime = 當前時間輪的interval
this.overflowTimeWheel = new MyHierarchicalHashedTimeWheelV2(
this.currentTime, this.interval, this.ringBucketArray.length, this.taskExecutor, this.bucketDelayQueue);
}
}
}
public class MyHierarchyHashedTimeWheelBucketV2 implements Delayed {
private final LinkedList<MyTimeoutTaskNode> taskList = new LinkedList<>();
private final AtomicLong expiration = new AtomicLong(-1);
public synchronized void addTimeout(MyTimeoutTaskNode timeout) {
taskList.add(timeout);
}
public synchronized void flush(Consumer<MyTimeoutTaskNode> flush) {
Iterator<MyTimeoutTaskNode> iterator = taskList.iterator();
while (iterator.hasNext()){
MyTimeoutTaskNode node = iterator.next();
// 從當前bucket中移除,轉移到更下層的時間輪中
iterator.remove();
flush.accept(node);
// 簡單起見,不考慮任務被外部自己取消的case(netty裡的timeout.isCancelled())
}
this.expiration.set(-1L);
}
/**
* 設定當前bucket的超時時間
* @return 是否是一個新的bucket true:是
* */
public boolean setExpiration(long expiration){
long oldValue = this.expiration.getAndSet(expiration);
// 如果不一樣,說明當前的expiration已經超過了原來的expiration一圈了,邏輯上不再是同一個bucket
return oldValue != expiration;
}
public long getExpiration(){
return this.expiration.get();
}
@Override
public long getDelay(TimeUnit unit) {
// 還剩餘多少時間過期
long delayNanos = Math.max(this.expiration.get() - System.nanoTime(), 0);
// 將納秒單位基於unit轉換
return unit.convert(delayNanos,TimeUnit.NANOSECONDS);
}
@Override
public int compareTo(Delayed o) {
if(o instanceof MyHierarchyHashedTimeWheelBucketV2){
return Long.compare(this.expiration.get(),((MyHierarchyHashedTimeWheelBucketV2) o).expiration.get());
}
return 0;
}
}
netty作為一個網路框架,大量的計時器任務的超時時間都是相對較短的(最大一般是秒級),時間上的排布相對密集,時間輪空轉的問題不是特別大(rounds的值也會很小,從建立到被排程的開銷很低)。
而kafka的計時器模組所要處理的任務其超時時間的跨度就相對大很多,時間上的排布很稀疏,所以引入延遲佇列來解決空轉問題收益就會大很多。