一文詳解redis中的高可用與持久化

2022-02-02 10:00:12
本篇文章帶大家聊聊redis中的高可用與持久化,看看Redis 持久化的功能、兩種方式(RDB和AOF),希望對大家有所幫助!

一、Redis 高可用

1. Redis 高可用概述

  在web伺服器中,高可用是指伺服器可以正常存取的時間,衡量的標準是在多長時間內可以提供正常服務(99.9%、99.99%、99.999%等等)。【相關推薦:Redis視訊教學

  但是在Redis語境中,高可用的含義似乎要寬泛一些,除了保證提供正常服務(如主從分離、快速容災技術),還需要考慮資料容量的擴充套件、資料安全不會丟失等。

2. Redis 高可用策略

在Redis中,實現高可用的技術主要包括持久化、主從分離、哨兵和叢集。

高可用策略說明
持久化持久化是最簡單的高可用方法(有時甚至不被歸為高可用的手段),主要作用是資料備份,即將資料儲存在硬碟,保證資料不會因程序退出而丟失。
主從複製主從複製是高可用Redis的基礎,哨兵和叢集都是在主從複製基礎上實現高可用的。主從複製主要實現了資料的多機備份,以及對於讀操作的負載均衡和簡單的故障恢復。缺陷:故障恢復無法自動化,寫操作無法負載均衡,儲存能力受到單機的限制。
哨兵在主從複製的基礎上,哨兵實現了自動化的故障恢復。缺陷:寫操作無法負載均衡,儲存能力受到單機的限制。
叢集通過叢集,Redis解決了寫操作無法負載均衡,以及儲存能力受到單機限制的問題,實現了較為完善的高可用方案。

二、Redis 持久化

1. Redis 持久化的功能

  Redis是記憶體資料庫,資料都是儲存在記憶體中,為了避免伺服器斷電等原因導致Redis程序異常退出後資料的永久丟失,需要定期將Redis中的資料以某種形式(資料或命令)從記憶體儲存到硬碟;當下次Redis重新啟動時,利用持久化檔案實現資料恢復。除此之外,為了進行災難備份,可以將持久化檔案拷貝到一個遠端位置。

2. Redis 持久化的兩種方式

  • RDB持久化
    原理是將Redis在記憶體中的資料庫記錄定時儲存到磁碟上。
  • AOF持久化(append only file)
    原理是將Redis的操作紀錄檔以追加的方式寫入檔案,類似於MySQL的binlog。
    由於AOF持久化的實時性更好,即當程序意外退出時丟失的資料更少,因此AOF是目前主流的持久化方式,不過RDB持久化仍然有其用武之地。

3. RDB 持久化

  RDB持久化是指在指定的時間間隔內將記憶體中當前程序中的資料生成快照儲存到硬碟(因此也稱為快照持久化),用二進位制壓縮儲存,儲存的檔案字尾是rdb;當Redis重新啟動時,可以讀取快照檔案恢復資料。

3.1 觸發條件

RDB持久化的觸發分為手動觸發和自動觸發兩種。

3.1.1 手動觸發

  • save命令和bgsave命令都可以生成RDB檔案。
  • save命令會阻塞Redis伺服器程序,直到RDB檔案建立完畢為止,在Redis伺服器阻塞期間,伺服器不能處理任何命令請求。
  • bgsave命令會fork()一個子程序,由子程序來負責建立RDB檔案,父程序(即Redis主程序)則繼續處理請求。
  • bgsave命令執行過程中,只有fork子程序時會阻塞伺服器,而對於save命令,整個過程都會阻塞伺服器,因此save已基本被廢棄,線上環境要杜絕save的使用。

3.1.2 自動觸發

  • 在自動觸發RDB持久化時,Redis也會選擇bgsave而不是save來進行持久化。

3.2 設定方式

  • 通過修改組態檔進行設定:save m n
  • 自動觸發最常見的情況是在組態檔中通過save m n,指定當m秒內發生n次變化時,會觸發bgsave。
[root@localhost ~]# vim /etc/redis/6379.conf ##219行,以下三個save條件滿足任意一個時,都會引起bgsave的呼叫save 900 1	##當時間到900秒時,如果redis資料發生了至少1次變化,則執行bgsavesave 300 10	##當時間到300秒時,如果redis資料發生了至少10次變化,則執行bgsavesave 60 10000	##當時間到60秒時,如果redis資料發生了至少10000次變化,則執行bgsave##254行,指定RDB檔名dbfilename dump.rdb##264行,指定RDB檔案和AOF檔案所在目錄dir /var/lib/redis/6379##242行,是否開啟RDB檔案壓縮rdbcompression yes

3.3 其他自動觸發機制

除了save m n以外,還有一些其他情況會觸發bgsave:

  • 在主從複製場景下,如果從節點執行全量複製操作,則主節點會執行bgsave命令,並將rdb檔案傳送給從節點。
  • 執行shutdown命令時,自動執行rdb持久化。

3.4 執行流程

在這裡插入圖片描述

  • Redis父程序首先判斷:當前是否在執行save,或bgsave/bgrewriteaof的子程序,如果在執行則bgsave命令直接返回。bgsave/bgrewriteaof的子程序不能同時執行,主要是基於效能方面的考慮;兩個並行的子程序同時執行大量的磁碟寫操作,可能引起嚴重的效能問題。
  • 父程序執行fork操作建立子程序,這個過程中父程序是阻塞的,Redis不能執行來自使用者端的任何命令。
  • 父程序fork後,bgsave命令返回「Background saving started」資訊並不再阻塞父程序,並可以響應其他命令
  • 子程序建立RDB檔案,根據父程序記憶體快照生成臨時快照檔案,完成後對原有檔案進行原子替換
  • 子程序傳送訊號給父程序表示完成,父程序更新統計資訊

3.5 啟動時載入

  RDB檔案的載入工作是在伺服器啟動時自動執行的,並沒有專門的命令。但是由於AOF的優先順序更高,因此當AOF開啟時,Redis會優先載入AOF檔案來恢復資料;只有當AOF關閉時,才會在Redis伺服器啟動時檢測RDB檔案,並自動載入。伺服器載入RDB檔案期間處於阻塞狀態,直到載入完成為止。
  Redis載入RDB檔案時,會對RDB檔案進行校驗,如果檔案損壞,則紀錄檔中會列印錯誤,Redis啟動失敗。

4. AOF 持久化

  RDB持久化是將程序資料寫入檔案,而AOF持久化則是將Redis執行的每次寫、刪除命令記錄到單獨的紀錄檔檔案中,查詢操作不會記錄;當Redis重新啟動時再次執行AOF檔案中的命令來恢復資料。
  與RDB相比,AOF的實時性更好,因此已成為主流的持久化方案。

4.1 開啟 AOF

Redis伺服器預設開啟RDB,關閉AOF;要開啟AOF,需要在組態檔中設定

[root@localhost ~]# vim /etc/redis/6379.conf ##700行,修改,開啟AOFappendonly yes##704行,指定AOF檔名稱appendfilename "appendonly.aof"##796行,是否忽略最後一條可能存在問題的指令aof-load-truncated yes[root@localhost ~]# /etc/init.d/redis_6379 restartStopping ...
Redis stopped
Starting Redis server...

4.2 執行流程

由於需要記錄Redis的每條寫命令,因此AOF不需要觸發,下面介紹AOF的執行流程。

AOF的執行流程包括:

  • 命令追加(append):將Redis的寫命令追加到緩衝區aof_buf;
  • 檔案寫入(write)和檔案同步(sync):根據不同的同步策略將aof_buf中的內容同步到硬碟;
  • 檔案重寫(rewrite):定期重寫AOF檔案,達到壓縮的目的。

4.2.1 命令追加(append)

Redis先將命令追加到緩衝區,而不是直接寫入檔案,主要是為了避免每次有寫命令都直接寫入硬碟,導致硬碟IO稱為Redis負載的瓶頸。

命令追加的格式是Redis命令請求的協定格式,它是一種純文字格式,具有相容性好、可讀性強、容易處理、操作簡單、避免二次開銷等優點。在AOF檔案中,除了用於指定資料庫的select命令(如select 0為選中0號資料庫)是由Redis新增的,其他都是使用者端傳送來的寫命令。

4.2.2 檔案寫入(write)和檔案同步(sync)

Redis提供了多種AOF快取區的同步檔案策略,策略涉及到作業系統的write和fsync函數,說明如下:
為了提高檔案寫入效率,在現代作業系統中,當使用者呼叫write函數將資料寫入檔案時,作業系統通常會將資料暫存到一個記憶體緩衝區裡,當緩衝區被填滿或超過了指定時限後,才真正將緩衝區的資料寫入到硬碟裡。這樣的操作雖然提高了效率,但也帶來了安全問題:如果計算機停機,記憶體緩衝區中的資料會丟失;因此係統同時提供了fsync、fdatasync等同步函數,可以強制作業系統立刻將緩衝區中的資料寫入到硬碟裡,從而確保資料的安全性。

4.2.3 三種同步方式

AOF快取區的同步檔案策略存在三種同步方式,通過對/etc/redis/6379.conf的729行的修改進行設定。

4.2.3.1 appendfsync always

命令寫入aof_buf後立即呼叫系統fsync操作同步到AOF檔案,fsync完成後執行緒返回。這種情況下,每次有寫命令都要同步到AOF檔案,硬碟IO成為效能瓶頸,Redis只能支援大約幾百TPS寫入,嚴重降低了Redis的效能;即便是使用固態硬碟(SSD),每秒大約也就只能處理幾萬個命令,而且會大大降低SSD的壽命。

4.2.3.2 appendfsync no

命令寫入aof_buf後呼叫系統write操作,不對AOF檔案做fsync同步;同步由作業系統負載,通常同步週期為30秒。這種情況下,檔案同步的時間不可控,且緩衝區中堆積的資料會很多,資料安全性無法保證。

4.2.3.3 appendfsync everysec(推薦)

命令寫入aof_buf後呼叫系統write操作,write完成後執行緒返回:fsync同步檔案操作由專門的執行緒每秒呼叫一次。everysec是前述兩種策略的折中,是效能和資料安全性的平衡,一次是Redis的預設設定,也是我們推薦的設定。

4.2.4 檔案重寫(rewrite)

隨著時間流逝,Redis伺服器執行的寫命令越來越多,AOF檔案也會越來越大;過大的AOF檔案不僅會影響伺服器的正常執行,也會導致資料恢復需要的時間過長。
檔案重寫是指定期重寫AOF檔案,減小AOF檔案的體積。需要注意的是,AOF重寫是把Redis程序內的資料轉化為寫命令,同步到新的AOF檔案;不會對舊的AOF檔案進行任何讀取、寫入操作。
關於檔案重寫需要注意的另一點是:對於AOF持久化來說,檔案重寫雖然是強烈推薦的,但並不是必須的;即使沒有檔案重寫,資料也可以被持久化並在Redis啟動的時候匯入;因此在一些現實中,會關閉自動的檔案重寫,然後定時任務在每天的某一時刻定時執行。

4.2.4.1 具有壓縮功能的原因

檔案重寫之所以能夠壓縮AOF檔案,原因在於:

  • 過期的資料不再寫入檔案。
  • 無效的命令不再寫入檔案:如有些資料被重複設定(set mykey v1,set mykey v2)、有些資料被刪除了(set myset v1,del myset)等。
  • 多條命令可以合併為一個:如sadd myset v1,sadd myset v2,sadd myset v3可以合併為sadd myset v1 v2 v3。

通過上述原因可以看出,由於重寫後AOF執行的命令減少了,檔案重寫既可以減少檔案佔用的空間,也可以加快恢復速度。

4.2.4.2 檔案重寫的觸發

檔案重寫分為手動觸發和自動觸發:

  • 手動觸發:直接呼叫bfrewriteaof命令,該命令的執行與bgsave有些類似,都是fork程序進行具體的工作,且都只有在fork時阻塞。
  • 自動觸發:通過設定auto-aof-rewrite-min-size選項和auto-aof-rewrite-percentage選項來自動執行bgrewriteaof。只有當auto-aof-rewrite-min-size和auto-aof-rewrite-percentage兩個選項同時滿足時,才會自動觸發AOF重寫,即bgrewriteaof操作。

自動觸發的設定位於/etc/redis/6379.conf的771行和772行

  • auto-aof-rewrite-percentage 100
    當前AOF檔案大小(即aof_current_size)是上次紀錄檔重寫時AOF檔案大小(aof_base_size)兩倍時,發生bgrewriteaof操作
  • auto-aof-rewrite-min-size 64mb
    當前AOF檔案執行bgrewriteaof命令的最小值,避免剛開始啟動Redis時由於檔案尺寸較小導致頻繁的bgrewriteaof
4.2.4.3 檔案重寫的流程

在這裡插入圖片描述
檔案重寫的流程如下:

  • Redis父程序首先平判斷當前是否存在正在執行bgsave/bgrewriteaof的子程序;如果存在則bgrewriteaof命令直接返回,如果存在bgsave命令則等bgsave執行完成後再執行。
  • 父程序執行fork操作建立子程序,這個過程中父程序是阻塞的。
  • 父程序fork後,bgrewriteaof命令返回「Background append only file rewrite started」資訊並不再阻塞父程序,並可以響應其他命令。Redis的所有寫命令依然寫入AOF緩衝區,並根據appendfsync策略同步到硬碟,保證原有AOF機制的正確。
  • 由於fork操作使用寫時複製技術,子程序只能共用fork操作時的記憶體資料。由於父程序依然在響應命令,因此Redis使用AOF重寫緩衝區(aof_rewrite_buf)儲存這部分資料,防止新AOF檔案生成期間丟失這部分資料。也就是說,bgrewriteaof執行期間,Redis的寫命令同時追加到aof_buf和aof_rewrite_buf兩個緩衝區。
  • 子程序根據記憶體快照,按照命令合併規則寫入到新的AOF檔案。
  • 子程序寫完新的AOF檔案後,向父程序發訊號,父程序更新統計資訊,具體可以通過info persistence檢視。
  • 父程序把AOF重寫緩衝區的資料寫入到新的AOF檔案,這樣就保證了新AOF檔案所儲存的資料庫狀態和伺服器當前狀態一致。
  • 使用新的AOF檔案替換老檔案,文成AOF重寫。

關於檔案重寫的流程,有兩點需要特別注意:

  • 重寫由父程序fork子程序進行
  • 重寫期間Redis執行的寫命令,需要追加到新的AOF檔案中,為此Redis引入例如aof_rewrite_buf快取

4.3 啟動時載入

  • 當AOF開啟時,Redis啟動時會優先載入AOF檔案來恢復資料;只有當AOF關閉時,才會載入RDB檔案恢復資料。
  • 當AOF開啟,但AOF檔案不存在時,即使RDB檔案存在也不會載入。
  • Redis載入AOF檔案時,會對AOF檔案進行校驗,如果檔案損壞,則紀錄檔中會列印錯誤,Redis啟動失敗。但如果是AOF檔案結尾不完整(機器突然宕機等容易導致檔案尾部不完整),且aof_load_truncated引數開啟,則紀錄檔中會輸出警告,Redis忽略掉AOF檔案的尾部,啟動成功。aof_load_truncated引數預設是開啟的。

5. RDB 和 AOF 的優缺點

RDB持久化

優點:RDB檔案緊湊,體積小,網路傳輸快,適合全量複製;恢復速度比AOF快很多。當然,與AOF相比,RDB最重要的優點之一是對效能的影響相對較小。
缺點:RDB檔案的知名缺點在於其資料快照的持久化方式決定了必然做不到實時持久化,而在資料越來越重要的今天,資料的大量丟失很多時候是無法接受的,因此AOF持久化成為主流。此外,RDB檔案需要滿足特定格式,相容性差(如老版本的Redis不相容新版本的RDB檔案)。
對於RDB持久化,一方面是bgsave在進行fork操作時Redis主程序會阻塞,另一方面,子程序向硬碟寫資料也會帶來IO壓力。

AOF持久化

與RDB持久化相對應,AOF的優先在於支援秒級持久化、相容性好,缺點是檔案大、恢復速度慢,對效能影響大。

對於AOF持久化,向硬碟寫資料的頻率大大提高(everysec策略下為秒級),IO壓力更大,甚至可能在成AOF追加阻塞問題。

AOF檔案的重寫與RDB的bgsave類似,會有fork時的阻塞和子程序的IO壓力問題。相對來說,由於AOF向硬碟中寫資料的頻率更高,因此對Redis主程序效能的影響會更大。

一般來說,建議關閉AOF的自動重寫功能,並在重寫操作設定計劃任務,放在凌晨業務量低的時候進行,以降低AOF對主程序效能的影響以及IO的讀寫壓力。

更多程式設計相關知識,請存取:!!

以上就是一文詳解redis中的高可用與持久化的詳細內容,更多請關注TW511.COM其它相關文章!