分散式與叢集傻傻分不清?生動形象只需一文全搞通!

2020-11-13 13:01:16

看書之類的種種概念生澀難懂,讓我來換一種通俗易懂的比喻來給大家舉列子,包大家一看就懂!

滑稽至上
在這裡插入圖片描述

單體架構:

家裡生小寶寶啦,由於自己沒有照顧小寶寶的經驗,所以請了位經驗豐富的月嫂。
這位月嫂從買菜,到做飯,洗衣,拖地,餵奶,哄睡,洗澡,換紙尿褲,擦屁股,做排氣操,夜間陪護,給奶媽做月子餐等等,全部都做。 這種叫做單體架構。

叢集:

什麼都做,一個月嫂怎麼夠呢,肯定忙不過來呀,那就請兩個月嫂吧,這叫做叢集。
高可用:
有一個月嫂過生日,想請假回去和親戚打一天麻將。如果只有一個月嫂,她走了,就叫做服務中斷了。 但是因為做了叢集,有兩個月嫂,走了一個,另一個還是能用,雖然相比較吃力一些,但是畢竟還是能用的,這個現象叫做高可用。

分散式:

一個月嫂,一個月的費用基本上都要1萬多,還有房貸,還有車貸,生活費用還高,實在是請不起兩位啊,那就還是請一位吧。 可是事情那麼多,她實在忙不過來,怎麼辦呢? 那就把爺爺請過來買菜,把奶奶請過來做飯。 這樣服務本來僅僅是由月嫂一人提供的,變成了和寶寶相關的由月嫂負責,採購由爺爺負責,餐飲由奶奶負責。 這就叫做分散式了。

低耦合:

做寶寶服務的月嫂去打麻將了,不影響做飯的奶奶。 做採購的爺爺去喝酒了,也不影響月嫂的寶寶服務,這叫做低耦合。
高內聚:
和寶寶相關的事情都是月嫂在做,月嫂兌奶方式快慢,只會影響自己,對爺爺和奶奶的服務沒影響. 這叫做高內聚。

叢集+分散式:

奶奶一個人做飯,做久了也煩啊,也累啊,也想打麻將呀。 那麼就把姥姥也請過來吧。 這樣做飯這個服務,就由奶奶和姥姥這個叢集來承擔啦。她們倆,誰想去汗蒸了,都有另一位繼續提供做飯服務。 這就叫做叢集+分散式。
在這裡插入圖片描述
本人在這裡整理了20多家公司的面試題,以及各種關於Spring、Spring boot、Spring MVC、MyBatis、MySQL、JVM等知識點,如果有需要的小夥伴可以加群1149778920 暗號:qf
在這裡插入圖片描述

不開玩笑了,說點正經的

分散式和叢集都是為了解決兩個問題:

高吞吐量(throughput)

  • 高可用(availability)

那既然他們倆都能解決這兩個問題,那擇其一為我所用就好啦,可為什麼我們的架構通常既是分散式,又是叢集呢?這不矛盾了嗎?

慢慢看下去一切自然就明瞭

首先咱們聊聊叢集

什麼是叢集,舉個列子就是我開飯店,僱了好多個水平一模一樣的廚師,既可以同時幫我做菜(高吞吐量),而且萬一有一個廚師回家娶媳婦了,我飯店裡還有別的廚師(他們可能會比平時忙),不至於要關門停業(高可用)我們常用的快取伺服器,比如Memcached和Redis,都是叢集架構,以Memcached為例,一開始我們只有一個Memcached節點:

在這裡插入圖片描述
Client把一些資料放到Memcached中,省的每次都是資料庫查,如果只有一個Memcached,那一旦請求壓力大了,Memcached很快就忙不過來(雖然Memcached是多執行緒),而且一旦Memcached掛了,那就沒有快取可以用了,全部請求都會走資料庫,資料庫的壓力會驟然增加!所以我們加多了兩個Memcached節點,形成Memcached叢集:

在這裡插入圖片描述
Memcached叢集實現了開頭提到的兩個特性:

  • 高吞吐量:通過負載均衡演演算法(通常是藉助一致性Hash和虛擬節點),我們把Client的請求均勻分配到三臺Memcached伺服器上,不至於只讓一臺Memcached疲於處理全部請求。

  • 高可用:一旦一臺Memcached節點掛了,比如說Memcached1,那借助一致性Hash演演算法和它的虛擬節點機制,我們可以將原本發給Client的Memcached1的請求均勻分配到Memcached2和3上,快取功能依舊可用。

有人說,請求會被分佈到各個Memcached節點,這不就是分散式嗎?

嚴格來說,這隻能算是「分佈的」(distributed),正如Memcached官網的介紹說的:

memcached is a high-performance, distributed memory object caching system

那什麼才算是分散式呢?(承上啟下,自然而然的引出下面對分散式的介紹,加5分 —— 語文老師評)

還是我開飯店的例子,飯店不能只有廚師啊,總不能讓客人來了直接跑到後廚跟廚師說他要吃什麼吧?所以還要前臺負責接待,要服務員負責送菜,還要收銀員負責結賬… 這樣一個各司其職,最後共同完成一件大事的系統,就形成了分散式。

還是上面那張圖,換個角度去看,就是分散式了,之前我們只看到了三臺Memcached節點,上面說了,這只是叢集,那要怎麼看才是分散式呢?把眼睛睜大!看整張圖!

在這裡插入圖片描述

為什麼說整張圖就是分散式了?因為這些節點各司其職,有專門負責資料持久化儲存的(Database),有對外提供業務存取的(Client,姑且認為是一個商品查詢服務吧),也有負責資料快取的(Memcached)什麼?你說這樣還不夠分散式?那就這樣吧(畫的有點ugly…):

在這裡插入圖片描述
夠分散式了吧 ( ̄▽ ̄)~*

分散式同樣實現了開頭提到的兩個特性:

  • 高吞吐量:我們把不同業務拆分到不同的機器上,比如使用者資訊查詢和訂單資訊查詢都是非常頻繁的業務操作,現在我們拆成了UserService和OrderService,放在不同的機子上執行,自然比都放在一臺機器上,吞吐量要高得多。

  • 高可用:我改了一行UserService的程式碼,部署過去,編譯失敗,節點掛掉了,最多就影響需要依賴UserService的業務,不會影響其他的,整個系統整體上還是可用的,而如果所有業務都放在一起,那就危險多了!一行程式碼編譯失敗,整個系統垮掉,整段垮掉!

可能有同學覺得這樣的分散式,和之前提到的Memcached將請求分散給各個節點進行處理,不都一樣嗎?Memcached叢集也是每個節點各司其職,每個節點負責一小部分請求,共同實現快取這個功能,這不也是分散式嗎?

再囉嗦一句你們就清楚了。

我們常說的分散式,或者說分散式(Distribution)這個術語,指的是各個異構的節點形成的系統,所謂異構,就是結構不同、功能不同的節點。

而Memcached叢集的各個節點呢?他們是同構的,一個快取的請求過來,比如說Set xxKey xxValue,那這個請求最終只會被一個Memcached節點處理,不會需要多個節點來共同完成這個請求。

而分散式呢,假設我有一個下單的請求,請求發給了OrderService,OrderService需要根據請求裡頭的userId補充使用者資訊,那就需要呼叫UserService提供的介面,然後我還要查詢這比訂單裡頭的商品資訊,所以又得去呼叫GoodService介面,最後,才能完成下單這個操作。

OrderService、UserService和GoodService共同完成了下單這件事,這才是分散式(Distribution),而Memcached叢集最多隻能算是「分佈的」(Distributed)。

文末

以上,希望對你有所幫助。

我在這裡整理出了Java進階架構師之路的核心知識,同時也是面試時面試官必問的知識點,篇章也是包括了很多知識點,其中包括了有基礎知識、Java集合、JVM、多執行緒並行、spring原理、微服務、Netty 與RPC 、Kafka、日記、設計模式、Java演演算法、資料庫、Zookeeper、分散式快取、資料結構等等

有需要的小夥伴可以點選這裡來加群:1149778920 暗號:Q F
在這裡插入圖片描述

在這裡插入圖片描述
在這裡插入圖片描述