長篇圖解etcd核心應用場景及編碼實戰

2022-08-31 12:00:35

大家好啊,我是字母哥,今天寫一篇關於etcd的文章,其實網上也有很多關於etcd的介紹,我就簡明扼要,總結提煉,期望大家通過這一篇文章掌握etcd的核心知識以及編碼技能

  • 本文首先用大白話給大家介紹一下etcd是什麼?這部分內容網上已經有很多了。
  • etcd有哪些應用場景?這些應用場景的核心原理是什麼?
  • 最後不能光動嘴不動手。先搭建一個etcd單機版,再使用java的使用者端操作etcd資料。

本文旨在幫助大家理解etcd,從宏觀角度俯瞰etcd全域性,掌握etcd的基本操作技能。後續我還會寫一個系列的文章,將每一種應用場景程式碼化,期待大家關注我和我的公眾號:字母哥雜談。後續計劃章節內容如下:

  • 《搭建高可用etcd叢集》
  • 《基於etcd實現分散式鎖(java程式碼實現)》
  • 《基於etcd實現設定變更通知(java程式碼實現)》
  • 《基於etcd實現服務註冊與發現(java程式碼實現)》
  • 《基於etcd實現分散式系統節點leader選舉(java程式碼實現)》

一、白話etcd與zookeeper

用過linux的朋友請舉手,好的,我看見了! 在 linux 中所有自動安裝的系統軟體組態檔都儲存在一個名為/etc的目錄中。「d」表示distributed分散式,etcd為分散式模型,所以etcd的核心應用場景是:分散式系統的設定資訊儲存

網上很多文章上來第一句話照搬英文官網:etcd 是一個高度一致的分散式鍵值儲存系統。很多朋友看完就問了,這玩意和redis有啥區別? 筆者要說,真的不要這麼比,etcd從名字上就已經告訴你了,它是儲存設定資訊(後設資料)的。和redis在架構應用上就不在一個層面,它對標的產品應該是zookeeper。雖然zookeeper在很多java的分散式系統的應用中比較廣泛,但是etcd作為後起之秀,乘kubernetes的東風,大有超越zookeeper的趨勢。

  • zookeeper是使用java寫的, etcd是使用go語言編寫的。zookeeper使用了TCP協定,其互動報文規則是完全自定義的,如果不使用zookeeper提供的SDK就無法運算元據。而etcd使用的是google的gRPC協定,普適性更好一些。
  • zookeeper對於一次請求,開啟一個socket進行監聽。而etcd的監聽管道channel可以反覆被利用,從IO效能到系統資源的利用的角度,etcd無疑是更優秀的。
  • zookeeper使用zab協定保證叢集節點設定資訊的一致性,etcd使用raft協定。期望詳細瞭解raft協定的,點選《raft協定中文介紹》

大部分功能和zookeeper都是一樣的,目前看java程式設計師用zookeeper的更多,其他程式設計師用etcd更多。都是基於習慣,但筆者推薦etcd。

二、etcd的4個核心機制

etcd以key-value的形式進行資料的儲存. 配合下面的這四種機制,使得etcd的應用場景更加的廣泛.

  • Prefix 機制:即字首機制,也稱目錄機制,使用者端向etcd放入2個鍵值對設定, 假如一個key是「/test/key1" , 另一個key是"/test/key2". 則通過字首"/test"查詢etcd,返回一個列表包含key為「/test/key1" 和"/test/key2"的鍵值對資料;
  • Watch 機制:即監聽機制,watch機制針對某個key進行監聽,也支援針對字首進行範圍監聽. 當被監聽的key 或字首範圍發生變化的時候,使用者端會收到變更通知;
  • Lease 機制:即租約機制(TTL,Time To Live),支援為key-value增加一個存活時間,超過這個時間key-value將過期被刪除. 支援解約(刪除key-value),續約(增加TTL時間)等操作.
  • Revision 機制:每個key帶有一個 全域性唯一的Revision 號,每一次事務加1,它是全域性唯一的,所以通過Revision可以判定資料寫操作的順序,對於實現分散式鎖和佇列非常有幫助.

三、Leader選舉與使用者端互動

使用etcd的時候,為了保證高可用,通常採用叢集的部署方式。部署奇數個節點,通常建議是3個或5個,因為etcd叢集之間需要通過網路互動保證設定資訊的一致性。分散式多節點保證了高可用,但是節點太多了也不好,越多的節點網路消耗越大。至於為什麼是奇數個?這就涉及到Leader選舉的問題,奇數個方便投票出結果。

etcd使用raft演演算法保證叢集內各個節點之間資料一致性。raft演演算法將叢集內的節點分為Leader, Follower, Candidate(候選人)這三個角色。

  • 叢集初始化的時候,每個節點都是Follower角色。通過raft演演算法選舉投票,選出一個節點作為Leader。
  • Leader作為主節點,與其他節點維持心跳,並同步資料至其他節點。
  • 當Follower一段時間內沒有收到leader的心跳,就會將自己角色改為Candidate候選者,並行起一次新的選舉,選舉新的Leader。

使用者端在操作etcd叢集資料的時候:

  • 讀操作:使用者端可以存取任意節點進行資料的讀操作
  • 寫操作:使用者端存取任意節點進行寫操作,如果該節點是Follower,則將請求轉發給Leader。由Leader負責資料的寫操作(增刪改),將資料持久化,並向Follower傳送同步資料的訊息。

四、etcd的應用場景

4.1. kubernetes大腦

目前,etcd的最典型的應用場景就是作為Kubernetes 叢集的大腦。


如果把kubernetes比作一個大飯店,那麼etcd就是這個飯店的進銷存+客戶關係管理系統。

  • kubernetes作為容器編排服務,將面向客戶提供的各種服務進行合理的資源分配,服務編排。
  • 不可避免地,有一些kubernetes叢集的設定和狀態資料,例如 pod 的數量、它們的狀態、名稱空間等。需要有一個統一的記錄、管理的地方,它就是etcd。

最重要的是:etcd具備watch監聽的功能,一旦某個設定或者某個狀態發生變更,叢集內所有的服務全都可以通過watch監聽機制實時獲取到訊息,進而做出進一步的響應。 幾乎etcd的所有應用場景,都是基於watch監聽機制產生的,包括我們後面為大家介紹的服務註冊發現和訂閱通知。

4.2. 服務註冊與發現

其實kubernetes也利用etcd實現服務註冊發現機制,但是上面的那張圖不太好說明,我新畫了兩張圖說明etcd在實現服務註冊發現機制中的作用。

所謂的服務註冊實現原理就是:服務在啟動的時候,向etcd寫入一條設定資料,該條設定資料說明自己的服務名稱,服務ip地址,伺服器埠等資訊。

所謂的服務發現實現原理舉例:服務C的某個範例希望存取服務A,服務C向etcd詢問服務A的存取地址,etcd響應結果:服務A有三個範例,地址列表如:xxx.xxx.xxx.xxx:埠yyy.yyy.yyy.yyy:埠zzz.zzz.zzz.zzz:埠。服務C不需要存取三個範例,存取其中一個就可以得到結果,所以它按照自己的負載均衡演演算法選了一個,這個就叫做:使用者端負載均衡。

4.3. 健康檢查與狀態變更通知

銜接上文:服務C下一次存取服務A的時候,還需要存取etcd麼?答案是不需要,它存取過一次之後,就會自己維護一個服務A存取地址的列表,除非這個列表發生變化,否則是不會再次去詢問etcd的。
那麼一個服務怎麼知道另一個服務的列表發生變化呢?比如:服務A的範例註冊狀態發生變化。可能是由於某種原因掛掉了,可能是OOM或者是網路問題等。

  • 服務在註冊到etcd之後,會儲存一個關於該服務的註冊設定資訊,該註冊設定資訊由一個TTL,etcd同時會與該服務維持心跳。一旦超過TTL時間,無法得到服務的心跳響應,etcd就認為該節點的健康狀態出現了問題,就會將該節點下線(註冊設定資訊刪除)。
  • 服務在註冊到etcd之後,會保持對etcd狀態資料變更的監聽,一旦獲取監聽結果:服務A的範例狀態發生變更,該服務就會從etcd重新拉取服務A的註冊列表。

4.4.分散式鎖

跨程序跨系統的多執行緒操作公共資源,發生多執行緒競爭,為了避免執行緒不安全,需要使用分散式鎖。如果多執行緒在單個程序內發生資源競爭,就是用Lock就可以了,不需要分散式鎖。比如:你在mysql庫裡面有一個使用者餘額資料,多個程序內的執行緒同時更改這個值,可能發生並行的資料覆蓋。為了避免這樣的問題,多個程序排排隊,A先來,A釋放了鎖B再來,B釋放了鎖C再來。


舉例:上圖的3個client代表三個服務,都要操作某個資源資料。

  • 在嘗試呼叫加鎖API的時候,client1獲取到的revision=1,它優先獲得加鎖的資格。加鎖就是加一個帶有revision的設定記錄。其他的所有的服務,都通過watch機制監聽鎖的釋放。
  • client在嘗試呼叫加鎖API的時候,被分配了revision。並且按照revision進行了排序,監聽距離自己revision差值最小,而且小於自己的Revision,不會產生驚群效應。

4.5.實現訊息佇列(純扯淡)

我覺得使用etcd實現訊息佇列,是一種純扯淡的做法。如果大家有什麼異議,歡迎留言!

不是說做不了,確實寫個demo是可以的。往etcd裡面放資料,再通過watch機制進行監聽,這不就是一個典型的訊息佇列麼?扯淡!如果我只為了實現訊息資料的釋出訂閱,其實有很多辦法,我還用搭一個etcd叢集?Spring的Event機制,java的響應式程式設計,哪怕自己搞一個BlockQueue呢,是不是都能實現訊息的釋出訂閱。

我們之所以使用kafka、RocketMQ這樣的訊息佇列,肯定是因為我們的非同步資料達到一定的規模了。達到規模的非同步訊息資料傳遞根本就不是etcd的應用場景,正如本文開頭所述:別忘了它叫做etc阿就d,它就是一個為分散式系統儲存設定資訊的,不是訊息中介軟體。

五、etcd安裝

本文為大家安裝一個可以用於實驗環境的etcd單機版,我們可以用它進行實驗,後續我還會寫文章介紹etcd叢集的安裝方式.
下載etcd的安裝包,存取github-etcd,我使用的是linux作業系統64位元,所以下載的安裝包是:etcd-v3.5.4-linux-amd64.tar.gz .如果網路條件不允許,可以搜尋"etcd國內下載加速",選擇合適的下載安裝包進行安裝即可.

首先將安裝包解壓,解壓之後cd進入安裝目錄,將etcd和etcdctl兩個命令copy到/usr/local/bin/目錄下面.

tar zxvf etcd-v3.5.4-linux-amd64.tar.gz;
cd etcd-v3.5.4-linux-amd64;
cp etcd etcdctl /usr/local/bin/;

通過etcd --version命令檢視etcd的版本,同時可以驗證安裝結果.如果不想敲全路徑,可以把/usr/local/bin目錄加入系統的PATH環境變數.

/usr/local/bin/etcd --version

啟動etcd,這裡的listen-client-urls和advertise-client-urls設定的作用是允許遠端連線,0.0.0.0表示監聽當前伺服器的所有ip, 監聽埠是2379. 假如你的伺服器有多塊網路卡,多個固定ip,你想指定etcd服務在某一個ip上提供服務,就可以用這個ip替換0.0.0.0

/usr/local/bin/etcd  --listen-client-urls 'http://0.0.0.0:2379' --advertise-client-urls 'http://0.0.0.0:2379'

etcd啟動之後, 可以通過etcdctl命令向etcd中新增設定,如下所示使用put命令新增一個key=/dir1,value=aaa的鍵值對資料.可以使用get命令獲取該設定資訊.

# /usr/local/bin/etcdctl put /dir1 aaa
OK
# /usr/local/bin/etcdctl get /dir1
/dir1
aaa

六、jetcd的編碼實現設定管理

下面為大家介紹通過java API的方式操作etcd的資料,首先通過maven的座標引入jetcd.我使用的版本相對比較舊,最新的版本已經是0.7.8,不過我在使用的時候出現了與netty版本不一致的情況,報錯:找不到netty相關的一些類.所以我就回退到0.3.0版本,使用方式上都是一樣的.

<dependency>
    <groupId>io.etcd</groupId>
    <artifactId>jetcd-core</artifactId>
    <version>0.3.0</version>
</dependency>

下面的程式碼是使用jetcd操作etcd的設定資料,實現了資料的寫操作,讀操作,刪除操作.詳細用法看程式碼吧.下面的程式碼是Junit 5的單元測試用例的寫法.

import io.etcd.jetcd.ByteSequence;
import io.etcd.jetcd.Client;
import io.etcd.jetcd.KV;
import io.etcd.jetcd.kv.GetResponse;
import io.etcd.jetcd.kv.PutResponse;
import org.junit.jupiter.api.*;

import java.nio.charset.StandardCharsets;
import java.util.concurrent.CompletableFuture;
import java.util.concurrent.ExecutionException;

import static junit.framework.TestCase.assertNotNull;

//這個註解配合函數的Order註解,決定測試用例函數的執行順序
@TestMethodOrder(MethodOrderer.OrderAnnotation.class)
public class EtcdTest {
  private static Client etcdClient;

  @BeforeAll
  static void  init(){
    etcdClient = Client.builder()
             //這裡的etcd服務列表可以寫多個,用逗號分隔
            .endpoints("http://192.168.161.3:2379".split(","))
            .build();
  }

  @Test
  @Order(1)
  @DisplayName("etcd寫設定操作")
  void putKV() throws ExecutionException, InterruptedException {
    KV kv = etcdClient.getKVClient();
    ByteSequence key = ByteSequence.from("key-str", StandardCharsets.UTF_8);
    ByteSequence value = ByteSequence.from("value-str", StandardCharsets.UTF_8);
    //put key-value設定資訊
    CompletableFuture<PutResponse> putRsp = kv.put(key,value);
    assertNotNull(putRsp.get().getHeader());
  }


  @Test
  @Order(2)
  @DisplayName("etcd讀設定操作")
  void getKV() throws ExecutionException, InterruptedException {
    KV kv = etcdClient.getKVClient();
    ByteSequence key = ByteSequence.from("key-str", StandardCharsets.UTF_8);
    //通過key獲取值
    CompletableFuture<GetResponse> getRsp = kv.get(key);
    String getBackValue = getRsp.get().getKvs().get(0).getValue().toString(StandardCharsets.UTF_8);
    System.out.println("從etcd通過key獲取value值為:" + getBackValue);
  }


  @Test
  @Order(3)
  @DisplayName("刪除設定操作")
  void deleteKV() {
    KV kv = etcdClient.getKVClient();
    ByteSequence key = ByteSequence.from("key-str", StandardCharsets.UTF_8);
    //通過key刪除資料
    kv.delete(key);
  }
}

上面的程式碼只介紹了etcd的最基本的key-value操作,其實etcd使用者端還提供了很多的API,這些都將在我後續的文章中分散式鎖,服務註冊發現,設定變更監聽,分散式系統Leader選舉的內容中為大家介紹.

//租約
Lease lease=etcdClient.getLeaseClient();
//監聽
Watch watch =etcdClient.getWatchClient();
//選舉
Election election =etcdClient.getElectionClient();
//鎖
Lock lock=etcdClient.getLockClient();

歡迎關注我的公告號:字母哥雜談,回覆003贈送作者專欄《docker修煉之道》的PDF版本,30餘篇精品docker文章。字母哥部落格:zimug.com