提到 ,相信大部分前端工程師都會想到基於它來開發伺服器端,只需要掌握 JavaScript 一門語言就可以成為全棧工程師,但其實 Node.js 的意義並不僅於此。
很多高階語言,執行許可權都可以觸及作業系統,而執行在瀏覽器端的 JavaScript 則例外,瀏覽器為其建立的沙箱環境,把前端工程師封閉在一個程式設計世界的象牙塔裡。不過 Node.js 的出現則彌補了這個缺憾,前端工程師也可以觸達計算機世界的底層。
所以 對於前端工程師的意義不僅在於提供了全棧開發能力,更重要的是為前端工程師開啟了一扇通向計算機底層世界的大門。本文通過分析 Node.js 的實現原理來開啟這扇大門。
Node.js 原始碼倉庫的 /deps 目錄下有十幾個依賴,其中既有 C 語言編寫的模組(如 libuv、V8)也有JavaScript 語言編寫的模組(如 acorn、acorn-plugins),如下圖所示。
其中最重要的是 v8 和 uv 兩個目錄對應的模組。v8本身並沒有非同步執行的能力,而是藉助瀏覽器的其他執行緒實現的,這也正是我們常說js是單執行緒的原因,因為其解析引擎只支援同步解析程式碼。 但在 Node.js 中,非同步實現主要依賴於 libuv,下面我們來重點分析 libuv 的實現原理。
libuv 是一個用 C 編寫的支援多平臺的非同步 I/O 庫,主要解決 I/O 操作容易引起阻塞的問題。 最開始是專門為 Node.js 使用而開發的,但後來也被 Luvit、Julia、pyuv 等其他模組使用。下圖是 libuv 的結構圖。
libuv有兩種非同步的實現方式,分別是上圖左右兩個被黃框選中的部分。
左邊部分為網路 I/O 模組,在不同平臺下有不同的實現機制,Linux 系統下通過 epoll 實現,OSX 和其他 BSD 系統採用 KQueue,SunOS 系統採用 Event ports,Windows 系統採用的是 IOCP。由於涉及作業系統底層 API,理解起來比較複雜,這裡就不多介紹了。
右邊部分包括檔案 I/O 模組、DNS 模組和使用者程式碼,通過執行緒池來實現非同步操作。檔案 I/O 與網路 I/O不同,libuv 沒有依賴於系統底層的 API,而是在全域性執行緒池中執行阻塞的檔案 I/O 操作。
下圖是 libuv 官網給出的事件輪詢工作流程圖,我們結合程式碼來一起分析。
libuv 事件迴圈的核心程式碼是在 uv_run() 函數中實現的,下面是 Unix 系統下的部分核心程式碼。雖然是用 C 語言編寫的,但和 JavaScript 一樣都是高階語言,所以理解起來也不算太困難。最大的區別可能是星號和箭頭,星號我們可以直接忽略。例如,函數引數中 uv_loop_t* loop 可以理解為 uv_loop_t 型別的變數 loop。箭頭 「→」 可以理解為點號「.」,例如,loop→stop_flag 可以理解為 loop.stop_flag。
int uv_run(uv_loop_t* loop, uv_run_mode mode) { ... r = uv__loop_alive(loop); if (!r) uv__update_time(loop); while (r != 0 && loop - >stop_flag == 0) { uv__update_time(loop); uv__run_timers(loop); ran_pending = uv__run_pending(loop); uv__run_idle(loop); uv__run_prepare(loop);...uv__io_poll(loop, timeout); uv__run_check(loop); uv__run_closing_handles(loop);... }... }
uv__loop_alive
這個函數用於判斷事件輪詢是否要繼續進行,如果 loop 物件中不存在活躍的任務則返回 0 並退出迴圈。
在 C 語言中這個 「任務」 有個專業的稱呼,即「控制程式碼」,可以理解為指向任務的變數。控制程式碼又可以分為兩類:request 和 handle,分別代表短生命週期控制程式碼和長生命週期控制程式碼。具體程式碼如下:
static int uv__loop_alive(const uv_loop_t * loop) { return uv__has_active_handles(loop) || uv__has_active_reqs(loop) || loop - >closing_handles != NULL; }
uv__update_time
為了減少與時間相關的系統呼叫次數,同構這個函數來快取當前系統時間,精度很高,可以達到納秒級別,但單位還是毫秒。
具體原始碼如下:
UV_UNUSED(static void uv__update_time(uv_loop_t * loop)) { loop - >time = uv__hrtime(UV_CLOCK_FAST) / 1000000; }
uv__run_timers
執行 setTimeout() 和 setInterval() 中到達時間閾值的回撥函數。這個執行過程是通過 for 迴圈遍歷實現的,從下面的程式碼中也可以看到,定時器回撥是儲存於一個最小堆結構的資料中的,當這個最小堆為空或者還未到達時間閾值時退出迴圈。
在執行定時器回撥函數前先移除該定時器,如果設定了 repeat,需再次加到最小堆裡,然後執行定時器回撥。
具體程式碼如下:
void uv__run_timers(uv_loop_t * loop) { struct heap_node * heap_node; uv_timer_t * handle; for (;;) { heap_node = heap_min(timer_heap(loop)); if (heap_node == NULL) break; handle = container_of(heap_node, uv_timer_t, heap_node); if (handle - >timeout > loop - >time) break; uv_timer_stop(handle); uv_timer_again(handle); handle - >timer_cb(handle); } }
uv__run_pending
遍歷所有儲存在 pending_queue 中的 I/O 回撥函數,當 pending_queue 為空時返回 0;否則在執行完pending_queue 中的回撥函數後返回 1。
程式碼如下:
static int uv__run_pending(uv_loop_t * loop) { QUEUE * q; QUEUE pq; uv__io_t * w; if (QUEUE_EMPTY( & loop - >pending_queue)) return 0; QUEUE_MOVE( & loop - >pending_queue, &pq); while (!QUEUE_EMPTY( & pq)) { q = QUEUE_HEAD( & pq); QUEUE_REMOVE(q); QUEUE_INIT(q); w = QUEUE_DATA(q, uv__io_t, pending_queue); w - >cb(loop, w, POLLOUT); } return 1; }
uvrun_idle / uvrun_prepare / uv__run_check
這 3 個函數都是通過一個宏函數 UV_LOOP_WATCHER_DEFINE 進行定義的,宏函數可以理解為程式碼模板,或者說用來定義函數的函數。3 次呼叫宏函數並分別傳入 name 引數值 prepare、check、idle,同時定義了 uvrun_idle、uvrun_prepare、uv__run_check 3 個函數。
所以說它們的執行邏輯是一致的,都是按照先進先出原則迴圈遍歷並取出佇列 loop->name##_handles 中的物件,然後執行對應的回撥函數。
#define UV_LOOP_WATCHER_DEFINE(name, type) void uv__run_##name(uv_loop_t* loop) { uv_##name##_t* h; QUEUE queue; QUEUE* q; QUEUE_MOVE(&loop->name##_handles, &queue); while (!QUEUE_EMPTY(&queue)) { q = QUEUE_HEAD(&queue); h = QUEUE_DATA(q, uv_##name##_t, queue); QUEUE_REMOVE(q); QUEUE_INSERT_TAIL(&loop->name##_handles, q); h->name##_cb(h); } } UV_LOOP_WATCHER_DEFINE(prepare, PREPARE) UV_LOOP_WATCHER_DEFINE(check, CHECK) UV_LOOP_WATCHER_DEFINE(idle, IDLE)
uv__io_poll
uv__io_poll 主要是用來輪詢 I/O 操作。具體實現根據作業系統的不同會有所區別,我們以 Linux 系統為例進行分析。
uv__io_poll 函數原始碼較多,核心為兩段迴圈程式碼,部分程式碼如下:
void uv__io_poll(uv_loop_t * loop, int timeout) { while (!QUEUE_EMPTY( & loop - >watcher_queue)) { q = QUEUE_HEAD( & loop - >watcher_queue); QUEUE_REMOVE(q); QUEUE_INIT(q); w = QUEUE_DATA(q, uv__io_t, watcher_queue); e.events = w - >pevents; e.data.fd = w - >fd; if (w - >events == 0) op = EPOLL_CTL_ADD; else op = EPOLL_CTL_MOD; if (epoll_ctl(loop - >backend_fd, op, w - >fd, &e)) { if (errno != EEXIST) abort(); if (epoll_ctl(loop - >backend_fd, EPOLL_CTL_MOD, w - >fd, &e)) abort(); } w - >events = w - >pevents; } for (;;) { for (i = 0; i < nfds; i++) { pe = events + i; fd = pe - >data.fd; w = loop - >watchers[fd]; pe - >events &= w - >pevents | POLLERR | POLLHUP; if (pe - >events == POLLERR || pe - >events == POLLHUP) pe - >events |= w - >pevents & (POLLIN | POLLOUT | UV__POLLRDHUP | UV__POLLPRI); if (pe - >events != 0) { if (w == &loop - >signal_io_watcher) have_signals = 1; else w - >cb(loop, w, pe - >events); nevents++; } } if (have_signals != 0) loop - >signal_io_watcher.cb(loop, &loop - >signal_io_watcher, POLLIN); }... }
在 while 迴圈中,遍歷觀察者佇列 watcher_queue,並把事件和檔案描述符取出來賦值給事件物件 e,然後呼叫 epoll_ctl 函數來註冊或修改 epoll 事件。
在 for 迴圈中,會先將 epoll 中等待的檔案描述符取出賦值給 nfds,然後再遍歷 nfds,執行回撥函數。
uv__run_closing_handles
遍歷等待關閉的佇列,關閉 stream、tcp、udp 等 handle,然後呼叫 handle 對應的 close_cb。程式碼如下:
static void uv__run_closing_handles(uv_loop_t * loop) { uv_handle_t * p; uv_handle_t * q; p = loop - >closing_handles; loop - >closing_handles = NULL; while (p) { q = p - >next_closing; uv__finish_close(p); p = q; } }
雖然 process.nextTick 和 Promise 都是非同步 API,但並不屬於事件輪詢的一部分,它們都有各自的任務佇列,在事件輪詢的每個步驟完成後執行。所以當我們使用這兩個非同步 API 的時候要注意,如果在傳入的回撥函數中執行長任務或遞迴,則會導致事件輪詢被阻塞,從而 「餓死」I/O 操作。
下面的程式碼就是通過遞迴呼叫 prcoess.nextTick 而導致 fs.readFile 的回撥函數無法執行的例子。
fs.readFile('config.json', (err, data) = >{... }) const traverse = () = >{ process.nextTick(traverse) }
要解決這個問題,可以使用 setImmediate 來替代,因為 setImmediate 會在事件輪詢中執行回撥函數佇列。process.nextTick 任務佇列優先順序比 Promise任務佇列更高,具體的原因可以參看下面的程式碼:
function processTicksAndRejections() { let tock; do { while (tock = queue.shift()) { const asyncId = tock[async_id_symbol]; emitBefore(asyncId, tock[trigger_async_id_symbol], tock); try { const callback = tock.callback; if (tock.args === undefined) { callback(); } else { const args = tock.args; switch (args.length) { case 1: callback(args[0]); break; case 2: callback(args[0], args[1]); break; case 3: callback(args[0], args[1], args[2]); break; case 4: callback(args[0], args[1], args[2], args[3]); break; default: callback(...args); } } } finally { if (destroyHooksExist()) emitDestroy(asyncId); } emitAfter(asyncId); } runMicrotasks(); } while (! queue . isEmpty () || processPromiseRejections()); setHasTickScheduled(false); setHasRejectionToWarn(false); }
從 processTicksAndRejections() 函數中可以看出,首先通過 while 迴圈取出 queue 佇列的回撥函數,而這個 queue 佇列中的回撥函數就是通過 process.nextTick 來新增的。當 while 迴圈結束後才呼叫runMicrotasks() 函數執行 Promise 的回撥函數。
Node.js 的核心依賴 libuv的結構可以分兩部分,一部分是網路 I/O,底層實現會根據不同作業系統依賴不同的系統 API,另一部分是檔案 I/O、DNS、使用者程式碼,這一部分採用執行緒池來處理。
libuv 處理非同步操作的核心機制是事件輪詢,事件輪詢分成若干步驟,大致操作是遍歷並執行佇列中的回撥函數。
最後提到處理非同步的 API process.nextTick 和 Promise 不屬於事件輪詢,使用不當則會導致事件輪詢阻塞,其中一種解決方式就是使用 setImmediate 來替代。
更多node相關知識,請存取:!
以上就是什麼是libuv,淺析libuv中的事件輪詢(Node核心依賴)的詳細內容,更多請關注TW511.COM其它相關文章!