MVCC,全稱Multi-Version Concurrency Control,即多版本並行控制,是一種並行控制的方法,一般用在資料庫管理系統中,實現對資料庫的並行存取,比如在MySQL InnoDB中主要是為了提高資料庫並行效能,不用加鎖,非阻塞並行讀。
MVCC多版本並行控制指的是維持一個資料的多個版本,使得讀寫操作沒有衝突,快照讀是MySQL為實現MVCC的一個非阻塞讀功能。
MVCC是一種用來解決讀寫衝突的無鎖並行控制,也就是為事務分配單項增長的時間戳,為每個修改儲存一個版本,版本與事務時間戳關聯,讀操作唯讀該事務開始前的資料庫的快照(隔離級別RC下),所以MVCC為資料庫解決了以下問題:
主要依賴於記錄中的三個隱藏欄位、undolog,read view來實現的。
每行記錄,除了我們自定義的欄位外,還有資料庫隱式定義的DB_TRX_ID,DB_ROLL_PTR,DB_ROW_ID等欄位:
假設記錄如圖所示:
回滾紀錄檔,表示在進行insert,delete,update操作的時候產生的方便回滾的紀錄檔。
當資料發生更新和刪除操作的時候,實際只是設定了舊記錄的deleted_bit,並不是將過時的記錄刪除,因為為了節省磁碟空間,innodb有專門的purge執行緒來清除deleted_bit為true的記錄,如果某個記錄的deleted_id為true,並且DB_TRX_ID相對於purge執行緒的read view 可見,那麼這條記錄就是可以被清除的
底層操作:在事務2修改該行記錄資料時
1、對該資料行加排他鎖
2、把該行資料拷貝到undolog中,作為舊記錄
3、修改該行name為lisi,並且修改事務id=2,回滾指標指向拷貝到undolog的副本記錄中
4、提交事務,釋放鎖
底層操作:在事務3修改該行記錄資料時
1、對該資料行加排他鎖
2、把該行資料拷貝到undolog中,作為舊記錄,發現該行記錄已經有undolog了,那麼最新的舊資料作為連結串列的表頭,插在該行記錄的undolog最前面
3、修改該行age為32歲,並且修改事務id=3,回滾指標指向剛剛拷貝的undolog的副本記錄
4、提交事務,釋放鎖
從上述的一系列圖中,可以發現,不同事務或者相同事務的對同一記錄的修改,會導致該記錄的undolog生成一條記錄版本連結串列,undolog的表頭就是最新的舊記錄,表尾就是最早的舊記錄。
Read View是事務進行快照讀操作的時候生產的讀檢視,在該事務執行快照讀的那一刻,系統會生成一個此刻的快照,記錄並維護系統此刻活躍事務的id,用來做可見性判斷的,也就是說當某個事務在執行快照讀的時候,對該記錄建立一個Read View的檢視,把它當作條件去判斷當前事務能夠看到哪個版本的資料,有可能讀取到的是最新的資料,也有可能讀取到的是當前行記錄的undolog中某個版本的資料
將要被修改的資料的最新記錄中的DB_TRX_ID(當前事務id)取出來,與系統此刻其他活躍事務的id去對比,如果DB_TRX_ID跟Read View的屬性做了比較,不符合可見性,那麼就通過DB_ROLL_PTR回滾指標去取出undolog中的DB_TRX_ID做比較,即遍歷連結串列中的DB_TRX_ID,直到找到滿足條件的DB_TRX_ID,這個DB_TRX_ID所在的舊記錄就是當前事務能看到的資料。
首先要知道Read View中的三個全域性屬性:
具體的比較規則如下:
流程圖如下:
總結:兩種情況可見
假設有四個事務同時在執行,如下圖所示:
事務1 | 事務2 | 事務3 | 事務4 |
---|---|---|---|
事務開始 | 事務開始 | 事務開始 | 事務開始 |
… | … | … | 修改且已提交 |
進行中 | 快照讀 | 進行中 | |
… | … | … |
從上述表格中,我們可以看到,當事務2對某行資料執行了快照讀,資料庫為該行資料生成一個Read View檢視,可以看到事務1和事務3還在活躍狀態,事務4在事務2快照讀的前一刻提交了更新,所以在Read View中記錄了系統當前活躍事務1,3,維護在一個列表中。同時可以看到up_limit_id的值為1,而low_limit_id為5,如下圖所示:
在上述的例子中,只有事務4修改過該行記錄,並且在事務2進行快照讀前,就提交了事務,所以該行當前資料的undolog如下所示:
當事務2在快照讀該行記錄時,會拿著該行記錄的DB_TRX_ID去跟up_limit_id、lower_limit_id和活躍事務列表進行比較,從而判讀事務2能看到該行記錄的版本是哪個。
具體流程如下:
所以事務4修改後提交的最新結果對事務2的快照是可見的,因此事務2讀取到的最新資料記錄是事務4所提交的版本,而事務4提交的版本也是全域性角度的最新版本。
讀取的是最新版本的記錄,讀取時還要保證其它並行事務不能修改當前記錄,會對讀取的記錄進行加鎖
像不加鎖的select操作,就是快照讀,即非阻塞讀
是基於提高並行效能的考慮,快照讀是基於多版本並行控制,即MVCC,可以認為MVCC是行鎖的一個變種,但它在很多情況下,避免了加鎖操作,降低了開銷;
因為Read View生成時機的不同,從而造成RC、RR級別下快照讀的結果的不同
總結:在RC隔離級別下,是每個快照讀都會生成並獲取最新的Read View,而在RR隔離級別下,則是同一個事務中的第一個快照讀才會建立Read View,之後的快照讀獲取的都是同一個Read View.