大家都知道資料庫應用程式
它天生需要圍繞著資料檔案打轉,諸如包含資料的 .mdf
,事務紀錄檔的 .ldf
,很多時候深入瞭解這兩類檔案的合成原理,差不多對資料庫就能理解一半了,關於 .mdf
的合成前面的文章已經有所介紹,這篇我們來聊一下 .ldf
的一些內部知識,比如 LSN
。
如果大家玩過 SQLSERVER 的釋出訂閱或者 AlwaysOn 或多或少都見過 LSN
,比如下面的格式: 00000030:00018090:0002
,這一串編號到底是什麼意思呢?本質上指示的是 .ldf
檔案的某一個物理位置上的偏移,畫個圖大概如下:
從圖中可以看到其實是由 虛擬檔案號:紀錄檔段起始磁區編號:槽號編號
三部分組成,要了解這三部分就需要明白 .ldf
檔案是如何進行邏輯劃分的,畫個簡圖如下:
通過上面的圖很容易就能明白其中的邏輯關係,事務紀錄檔檔案被劃分成了多個 虛擬檔案
,虛擬檔案又劃分成了多個 紀錄檔段
,紀錄檔段又劃分成了多個 磁區
,紀錄檔段中紀錄檔記錄位置儲存在 槽號
中,有了這些理論基礎,接下來用一個案例來加深大家的理解吧。
新建一個 MyLSN
資料庫,再建立一個 test
表,插入 3w 條記錄,sql如下:
CREATE DATABASE MyLSN
GO
USE MyLSN
GO
CREATE TABLE test(a INT IDENTITY, b CHAR(10) DEFAULT 'aaaaaaaaaa')
SET NOCOUNT ON
INSERT INTO test (b) DEFAULT VALUES
GO 30000
SET NOCOUNT OFF
接下來通過 fn_dblog
來查詢和 dbo.test
表相關的事務紀錄檔記錄。
SELECT [Current LSN],
Operation,
Context,
AllocUnitName,
[RowLog Contents 0],
[Log Record],
[Log Record Length]
FROM fn_dblog(NULL, NULL)
WHERE AllocUnitName LIKE '%test%';
從圖中可以看到這是一個 INSERT
的事務紀錄檔記錄,這裡就拿編號 00000030:00000db0:0002
去定位 .ldf 中的物理偏移位置吧,要想獲取物理偏移就要知道下面偏移值才可以。
要想知道這個資訊,可以用 DBCC loginfo
命令,檢視 FSeqNo
下的 StartOffset
偏移值即可,即 0n48 對應的 4071424
,截圖如下:
大家都知道磁碟的磁區是 512byte,sqlserver 為了更好的寫入磁碟,也用了 512byte 這個粒度,所以偏移值就是 512 * 0xdb0
。
綜合上面就能定位到紀錄檔段的物理偏移值為:
lkd> ?0n4071424 + (0n3504*0n512)
Evaluate expression: 5865472 = 00000000`00598000
接下來用 WinHex
來定位 MyLSN_log.ldf
檔案偏移 00598000
的位置,定位之前先將資料庫離線。
ALTER DATABASE MyLSN SET OFFLINE
前面的 0x0003
表示該紀錄檔段只有 3 條記錄,後面的 0x019E
表示該紀錄檔段的大小為 414byte
,接下來就是槽號了,槽號位置的物理偏移計算規則如下:
lkd> ? 00598000 + 019E - 1
Evaluate expression: 5865885 = 00000000`0059819d
從圖中可以看到,slot2 的偏移值為 00C8
,即物理偏移值為 005980c8
。
lkd> ? 00598000 + 00C8
Evaluate expression: 5865672 = 00000000`005980c8
從上面框出的內容可以輕鬆的看到,事務紀錄檔中記錄了 Insert 的 aaaaaaaaaa
值,太棒了,起始就是 fn_dblog
查出來的 Log Record
值。
對 LSN 有一個深度的理解,對各種資料庫事務紀錄檔暴漲的故障分析都會有一個很好的理論基礎,後面我們再聊這些話題。