大家好,接著上次和大家一起學習了《MySQL DDL執行方式-Online DDL介紹》,那麼今天接著和大家一起學習另一種MySQL DDL執行方式之pt-soc。
在MySQL使用過程中,根據業務的需求對錶結構進行變更是個普遍的運維操作,這些稱為DDL操作。常見的DDL操作有在表上增加新列或給某個列新增索引。
DDL定義:
Data Definition Language,即資料定義語言,那相關的定義操作就是DDL,包括:新建、修改、刪除等;相關的命令有:CREATE,ALTER,DROP,TRUNCATE截斷表內容(開發期,還是挺常用的),COMMENT 為資料字典新增備註。
注意:DDL操作是隱性提交的,不能rollback,一定要謹慎哦!
下圖是執行方式的效能對比及說明:
圖1 易維平臺說明圖
下面本文將對DDL的執行工具之pt-osc進行簡要介紹及分析。如有錯誤,還請各位大佬們批評指正。
pt-online-schema-change - ALTER tables without locking them.
pt-online-schema-change alters a table’s structure without blocking reads or writes. Specify the database and table in the DSN. Do not use this tool before reading its documentation and checking your backups carefully.
pt-online-schema-change是Percona公司開發的一個非常好用的DDL工具,稱為 pt-online-schema-change,是Percona-Toolkit工具集中的一個元件,很多DBA在使用Percona-Toolkit時第一個使用的工具就是它,同時也是使用最頻繁的一個工具。它可以做到在修改表結構的同時(即進行DDL操作)不阻塞資料庫表DML的進行,這樣降低了對生產環境資料庫的影響。在MySQL5.6之前是不支援Online DDL特性的,即使在新增二級索引的時候有FIC特性,但是在修改表欄位的時候還是會有鎖表並阻止表的DML操作,這樣對於DBA來說是非常痛苦的,好在有pt-online-schema-change工具在沒有Online DDL時解決了這一問題。
Percona 公司是成立於2006年,總部在美國北卡羅來納的Raleigh。由 Peter Zaitsev 和 Vadim Tkachenko創立, 這家公司聲稱他們提供的軟體都是免費的,他們的收入主要來與開源社群,企業的支援,以及使用他們軟體的公司的支付他們提供support的費用。 而實際上這家公司"壟斷"了業內最流行資料庫支援類的軟體,並且還開發了一些其他的與資料庫相關的東西。
Percona-Toolkit工具集是Percona支援資料庫人員用來執行各種MySQL、MongoDB和系統任務的高階命令列工具的集合,這些任務太難或太複雜而無法手動執行。這些工具是私有或「一次性」指令碼的理想替代品,因為它們是經過專業開發、正式測試和完整記錄的。它們也是完全獨立的,因此安裝快速簡便,無需安裝任何庫。
Percona Toolkit 源自 Maatkit 和 Aspersa,這兩個最著名的 MySQL 伺服器管理工具包。它由 Percona 開發和支援。
pt-osc 用於修改表時不鎖表,簡單地說,這個工具建立一個與原始表一樣的新的空表,並根據需要更改表結構,然後將原始表中的資料以小塊形式複製到新表中,然後刪除原始表,然後將新表重新命名為原始名稱。在複製過程中,對原始表的所有新的更改(insert,delete,update)都將應用於新表,因為在原始表上建立了一個觸發器,以確保所有新的更改都將應用於新表。有關 pt-online-schema-change 工具的更多資訊,請查閱手冊檔案 。
pt-osc大致的工作過程如下:
1.建立一個和要執行 alter 操作的表一樣的新的空表結構(是alter之前的結構);
2.在新表執行alter table 語句(速度應該很快);
3.在原表中建立觸發器3個觸發器分別對應insert,update,delete操作,如果表中已經定義了觸發器這個工具就不能工作了;
4.以一定塊大小從原表拷貝資料到臨時表,拷貝過程中通過原表上的觸發器在原表進行的寫操作都會更新到新建的臨時表,保證資料不會丟失(會限制每次拷貝資料的行數以保證拷貝不會過多消耗伺服器資源,採用 LOCK IN SHARE MODE 來獲取要拷貝資料段的最新資料並對資料加共用鎖阻止其他對談修改資料,不過每次加S鎖的行數不多,很快就會被釋放);
5.將原表Rename為old表,再把新表Rename為原表(整個過程只在rename表的時間會鎖一下表,其他時候不鎖表);
6.如果有參考該表的外來鍵,根據alter-foreign-keys-method引數的值,檢測外來鍵相關的表,做相應設定的處理(根據修改後的資料,修改外來鍵關聯的子表),如果被修改表存在外來鍵定義但沒有使用
--alter-foreign-keys-method 指定特定的值,該工具不予執行;
7.預設最後將舊原表刪除、觸發器刪除。
圖2 pt-osc工作過程示意圖
Percona Toolkit 是成熟的,但是官方還是建議在使用前做到以下幾點:
•閱讀該工具的詳細檔案
•檢視該工具的已知「錯誤」
•在非生產伺服器上測試該工具
•備份您的生產資料並驗證備份
下載安裝:
從官方網站下載percona-toolkit,然後執行下面的命令進行安裝(範例):
# 安裝依賴包
yum install perl-TermReadKey.x86_64
yum install perl-DBI
yum install perl-DBD-MySQL
yum install perl-Time-HiRes
yum install perl-IO-Socket-SSL
# 安裝percona-toolkit
rpm -ivh percona-toolkit-3.1.0-2.el7.x86_64.rpm
執行類似下面的命令修改表結構:
pt-online-schema-change --alter="add column c1 int;" --execute D=test,t=table,u=user,p=password
alter引數指定修改表結構的語句,execute表示立即執行,D、t、u、p分別指定庫名、表名、使用者名稱和密碼,執行期間不阻塞其它並行的DML語句。pt-online-schema-change還有許多選項,具體用法可以使用pt-online-schema-change --help檢視聯機幫助。
pt-online-schema-change也存在一些侷限性:
1.在使用此工具之前,應為表定義PRIMARY KEY或唯一索引,因為它是DELETE觸發器所必需的;
2.如果表已經定義了觸發器,則不支援 pt-osc ;(注:不是不能有任何觸發器,只是不能有針對insert、update、delete的觸發器存在,因為一個表上不能有兩個相同型別的觸發器);
3.如果表具有外來鍵約束,需要使用選項
--alter-foreign-keys-method,如果被修改表存在外來鍵定義但沒有使用 --alter-foreign-keys-method 指定特定的值,該工具不予執行;
4.還是因為外來鍵,物件名稱可能會改變(indexes names 等);
5.在Galera叢集環境中,不支援更改MyISAM表,系統變數 wsrep_OSU_method 必須設定為總序隔離(Total Order Isolation,TOI);
6.此工具僅適用於 MySQL 5.0.2 及更新版本(因為早期版本不支援觸發器);
7.需要給執行的賬戶在 MySQL上授權,才能正確執行。(應在伺服器上授予PROCESS、SUPER、REPLICATION SLAVE全域性許可權以及 SELECT、INSERT、UPDATE、DELETE、CREATE、DROP、ALTER 和 TRIGGER 表許可權。Slave 只需要 REPLICATION SLAVE 和 REPLICATION CLIENT 許可權。)
下面的表格是國外技術牛人進行的測試資料,是Online DDL和pt-osc對一個包含1,078,880行的表應用一些alter操作的對比結果,僅供參考:
online ddl | pt-osc | |||||
---|---|---|---|---|---|---|
更改操作 | 受影響的行 | 是否鎖表 | 時間(秒) | 受影響的行 | 是否鎖表 | 時間(秒) |
新增索引 | 0 | 否 | 3.76 | 所有行 | 否 | 38.12 |
下降指數 | 0 | 否 | 0.34 | 所有行 | 否 | 36.04 |
新增列 | 0 | 否 | 27.61 | 所有行 | 否 | 37.21 |
重新命名列 | 0 | 否 | 0.06 | 所有行 | 否 | 34.16 |
重新命名列更改其資料型別 | 所有行 | 是 | 30.21 | 所有行 | 否 | 34.23 |
刪除列 | 0 | 否 | 22.41 | 所有行 | 否 | 31.57 |
更改表引擎 | 所有行 | 是 | 25.3 | 所有行 | 否 | 35.54 |
那麼現在的問題是,我們應該使用哪種方法來執行alter語句呢?
雖然pt-osc允許對正在更改的表進行讀寫操作,但它仍然會在後臺將表資料複製到臨時表,這會增加MySQL伺服器的開銷。所以基本上,如果Online DDL不能有效工作,我們應該使用 pt-sc。換句話說,如果Online DDL需要將資料複製到臨時表(algorithm=copy)並且該表將被長時間阻塞(lock=exclusive)或者在複製環境中更改大表時,我們應該使用 pt-osc工具。
pt-osc官方檔案:
https://docs.percona.com/percona-toolkit/pt-online-schema-change.html
本次和大家一起學習瞭解pt-online-schema-change工具,介紹了其產生的背景、基本工作流程、用法及相應的一些限制。還介紹了其與Online DDL執行方式的一些對比,如果錯誤還請指正。
目前可用的DDL操作工具包括pt-osc,github的gh-ost,以及MySQL提供的線上修改表結構命令Online DDL。pt-osc和gh-ost均採用拷表方式實現,即建立個空的新表,通過select+insert將舊錶中的記錄逐次讀取並插入到新表中,不同之處在於處理DDL期間業務對錶的DML操作。
到了MySQL 8.0 官方也對 DDL 的實現重新進行了設計,其中一個最大的改進是 DDL 操作支援了原子特性。另外,Online DDL 的 ALGORITHM 引數增加了一個新的選項:INSTANT,只需修改資料字典中的後設資料,無需拷貝資料也無需重建表,同樣也無需加排他 MDL 鎖,原表資料也不受影響。整個 DDL 過程幾乎是瞬間完成的,也不會阻塞 DML,不過目前8.0的INSTANT使用範圍較小,後續再對8.0的INSTANT做詳細介紹吧。
下一期文章將和大家一起學習、瞭解github的gh-ost,敬請期待哦!
作者:京東物流 劉鄧忠
來源:京東雲開發者社群