【文章首發於 極客時間:分散式資料庫30講】
感謝易家成前輩審稿
你好,我叫李兆龍,來自西安郵電大學,是一個軟體工程專業的大三學生。很高興有機會,跟你分享我學習《分散式資料庫 30 講》的經歷和心得。
故事還得從大二的寒假說起。2020 年是特殊的一年,因為疫情的原因,很多大學生其實都是在家度過第二個學期的。這對我來說,既是一個壞訊息,也是一個好訊息。
我說它是壞訊息,是因為在家度過了大學八分之一的寶貴時光,這確實是讓人覺得可惜的一件事情,畢竟在學校的生活實在是讓人懷念。
說是好訊息,則是因為這是一個整段的學習時間。它不像在學校上課的日子,時間被拆分成了多個片段,而且晚上十一點半樓管阿姨準時鎖門,每次我想去鑽研一些有意思的東西時,總感到不夠盡興。平時只有暑期留校的時候才有這種機會,所以我說這也是一個好訊息!
其實我最初只是基於 MySQL 學了資料庫原理,第一次看到多個機器組合產生的化學反應竟然如此有趣。於是在那個時候,我就已經在心中種下了一顆嚮往分散式的種子,也才有了後面的故事。
後來我有幸閱讀了 Redis 的原始碼。基礎的資料結構部分,包括後面的持久化、網路框架、和記憶體淘汰策略,雖然比較複雜,但是程式碼的實現畢竟沒有跳出單機的思維,所以我在閱讀上是沒有什麼大問題的。但是這個過程在學習到哨兵機制和叢集的時候發生了改變,這些改變來自於兩個方面,即分散式程式碼的設計與實現。
脫離了單機的程式,框架設計是複雜的。因為涉及到很多邊界條件的考慮,而相當一部分問題只有在程式的吞吐量到達一定程度的時候才會出現問題。雖然這些思路落地產生的程式碼看似並不複雜,但涉及分散式的程式碼調錯實在是讓人想抓耳撓腮。
總之,在經過了一個漫長的過程以後,我總算是搞清楚了 Redis 叢集與哨兵的設計與實現。雖然這一個階段已經結束,但是我對分散式儲存的興趣卻更加濃厚了。後來在一個前輩的指點下,我去學習了MIT 6.824,並且閱讀了Designing Data-Intensive Applications。完成了 6.824 的大部分的論文閱讀和實驗以後,我的心裡其實可以說有一些不是滋味。
課程的品質自然沒得說,我相信每一個真正沉心其中的人,一定願意豎起自己的大拇指。讓我感到不是滋味的原因是,國內相關資料的匱乏實在是讓人咋舌,我能夠找到的資料基本都是社群內高品質的部落格,而這類部落格的內容往往也只是點到為止,很少有相關知識的擴充套件。這對於像我這樣有這方面興趣的小白來說,確實是一個不小的挑戰。
大概七月的時候,我知道了本校軟體工程專業在大三上半學期,會開設分散式原理的課程。說實話,我在假期的時候確實是為此興奮了很久。但是實際課程的效果其實更偏向於科普,對於分散式中每一個細分的地方都是泛泛而談,跟程式碼實現的距離著實不近,而且代課老師的研究方向也並不是這個領域。
我所在的實驗室「XiyouLinux 興趣小組」的研究方向,也是偏向於 Linux 核心,而不涉及分散式。因此,我從學校獲取更多資源的願望也泡湯了。所以,很多時候我還是很羨慕一些學校更好的同學的。
於是,更加深入的學習,我就只能靠閱讀分散式基礎理論論文和一些經典工業實現的論文。這樣雖好,但是卻缺乏一個站在更高角度的宏觀指導。這樣的學習其實是事倍功半的,但我卻沒有更好的辦法。在此「絕境之時」,我正好看到了王磊老師的《分散式資料庫 30 講》這門課程,實在可以說是恰逢甘霖!它正好填補了我心中缺失的那塊拼圖,所以我學習這門課程的信念也就越來越堅定了!
我應該算是最早的一批學習這個課程的同學了,在第一次看到課程的時候,它才更新了兩講而已。當時還是暑假期間,每天的時間都非常充裕。
王磊老師的更新進度是一週三更,我的學習過程是「一週四看」。老師會在在一三五零點更新課程,我就在第二天早上八點準時坐在電腦前準備把老師想要傳達給我們的資訊儘可能地汲取到大腦中來,這是三看。
還有一看呢,我分成兩個部分。Top half 就是週六週日中某一天的晚上,抽出兩個小時左右的時間去把本週的知識點再思考一遍,嘗試與以前學過的知識串聯起來。比如從全域性時鐘中想到了 Lamport 的「Time, Clocks and the Ordering of Events in a Distributed System」,進而聯想到無鎖程式設計。還記得以前簡單學習 C++ 無鎖程式設計的時候,其記憶體序的設計實在是讓人難以理解,由邏輯時鐘中得到的啟發,也讓我對無鎖程式設計理解比以前更深了一步。
Bottom half 則為思考老師對我和其他同學留言中所提問題的解答,以及其他優秀的同學的解答。我認為這也是學習中很重要的一個部分,因為課程的讀者中也有很大一部分經驗豐富的優秀工程師,他們的見解往往也是精準老辣,也讓我受益匪淺。
還有一點也非常的重要,就是對於老師課程中提到的以前沒有了解過的知識點在瞭解以後及時記錄,如果有新的理解或者現有的部落格描述不清的話還可以記錄成一篇部落格,既方便自己以後溫習,又能為其他朋友提供一個參考,何樂而不為呢?
美好的事物總是短暫的,最典型的代表就是假期。暑假這個大段的適合鑽研自己喜歡的東西的學習時間沒有了,取而代之的是需要遵循學校的課程時間。
學校的課程壓力確實很重。雖然這學期的課程的知識大多我都已經在大二學習完了,但是老師佈置作業的時候卻是手下不留情;而且計算機網路和 OS 這些課,以前學習的一些細節我遺忘也比較嚴重;此外,每天還必須要寫的演演算法題和完善馬上春招的專案,這些基本把工作日全部的時間都牢牢佔據了。
於是,我學習老師課程與閱讀論文的時間就只能放在週末了,所以在學校內一般是在週末去學習老師本週的更新內容。當然,雖然學習王磊老師課程的時間被壓縮了,但學習品質是不能夠被壓縮的,在學習兩到三講以後,還是需要像假期一樣溫習前幾講所學的東西。其實對大多數像我這樣的普通人來說,學習沒有什麼捷徑,不如像個賣油翁一樣,無他,唯勤奮爾。
從開篇詞中就可以看出,王磊老師的經驗是非常豐富的。在看到第一眼的時候我就想,如果老師能夠把這些經驗用文字呈現出來,哪怕只是一部分,對於我的幫助也絕對是巨大的。
因為我在前面就提到過,我現階段學習分散式,最大障礙就是無法站在一個宏觀的角度看問題。我之前的學習路線,是看分散式基礎理論和成功的工業實現的論文,僅靠我一個人其實很難把全部的知識串聯起來,進而形成網狀的知識體系。
而且一個成功的分散式系統往往是根據某些特定的需求,在此基礎上做出取捨。論文往往只說它用了什麼,而很少提及為什麼不用別的。我也不知道有沒有其他解決此類問題的方法,要解決只能去花很大的功夫查詢資料,而資料又是匱乏的。此時老師的課程就顯得尤為珍貴,因為老師對於課程涉及到的問題,基本上把相關的解決方案都列舉出來了,而且還詳細地對比了各種方案之間的異同。
比如在第 5 講介紹全域性時鐘的時候,老師對於多種方案的比較確實是讓人耳目一新的。以前我只是簡單瞭解過 Spanner 的 TrueTime,就以為搞懂了授時這個問題。在學習了這一課以後,我才知道授時的方案該如何劃分,還知道了其他的授時方案。如此看來,以前實在是見識短淺啊,在學完這一課以後,我才算是真正地初步瞭解這個問題。
老師的課程不僅僅是包含分散式相關的描述,更多的部分是描述資料庫的設計要領與各種抉擇,而這些於我們來說也是很重要的,值得仔細思考。
很多看起來微不足道的進步,都是在不計其數的大牛經過漫長的時間研究和試錯才得出的,更不必說分散式資料庫這樣璀璨耀眼的軟體。而我們卻能夠站在巨人的肩膀上去學習,這對像我這樣愛好者來說也未嘗不是一種幸運。能夠深入、正確地學習喜愛的東西,我想這就是最大的收穫了。
當今的網際網路環境無時無刻不在販賣焦慮,尤其以網際網路專業為最,我這個大三的普通學生更是感到迷茫不已。擺在面前的問題是很嚴峻的,在學校學習,如何把精力用在刀刃上?如此迅速的技術變革我們該如何立足?技術的背後共通點是什麼?
私以為,技術的變革來源於需求的變革或者創新,刀刃與共通點就是基礎技術。如果我們能夠靜下心來好好學習這些基礎技術,比如這門課所展現給我們的作者寶貴的經驗,我相信在未來可預測到的新的技術浪潮中,一定有我們的一席之地!
博觀而約取,厚積而薄發。這是 XiyouLinux 興趣小組教給我的,我想這也是每一個現在或者未來的 IT 行業從業者所要牢記心中的。堅持學習,如果現在還沒有看到效果,也不必灰心,在可見的未來一定可以綻放屬於自己的那一道光!
正如王磊老師在開篇詞中所言,分散式資料庫凝聚了無數學者與工程師的智慧,燦若星辰!我希望學習這門課程的每一個人都能成為那個「手握日月摘星辰」的人!