MatrixOne 0.2.0 效能測試報告

2022-02-23 17:00:09

一、測試結果

最新發布的MatrixOne 0.2.0版本新增了Benchmarks章節,針對常規測試程式SSB與紐約出租車資料測試,在支援分散式強一致性前提下,基於向量化執行引擎和因子化加速的技術加持,MatrixOne計算引擎在查詢速度方面表現突出,可以承載TB級別資料的快速查詢,與同類資料庫產品相比有較明顯的優勢。

  • 單機單表的SSB測試:MatrixOne比Clickhouse快50%以上

  • 單機多表的SSB測試:MatrixOne比Clickhouse快100%以上

  • 叢集多表的SSB測試:大幅快於Clickhouse。由於Clickhouse叢集多表的能力有限,多表測試不詳細展開對比。

MatrixOne專案作為一款從零開始自主打造的超融合資料庫專案,經過8個月左右的開發,在分散式強一致的能力融合後,計算查詢效能依然達到了可以與世界頂尖OLAP資料庫效能媲美水平。

未來MatrixOne還將在融合更多引擎能力的同時堅持對極致效能的持續追求,為使用者創造極簡、快速的資料庫產品體驗。

二、測試內容

  • 單機與叢集上SSB測試單表、多表查詢

  • 單機伺服器上紐約出租車資料的單表查詢

  • 測試硬體設定:本次所有測試所使用的伺服器設定均為「AMD EPYC™ Rome CPU 2.6GHz/3.3GHz, 16核, 32 GiB 記憶體」

  • 更加詳細的測試資訊可參見 「」

三、SSB測試

SSB測試基於TPC定義的TCP-H規範,是一套用於測試資料庫產品在星型模式下效能表現的基準測試規範,目前在學術界和工業界都得到了廣泛的使用。它將TPC-H的雪花模式簡化為了星型模式,將基準查詢由TPC-H的複雜Ad-Hoc查詢改為了結構更固定的OLAP查詢。

1. 測試概況

為體現MatrixOne的單表查詢能力,特將SSB測試中所含有的五張資料表:lineorder, part, supplier, customer, dates合成為一張寬表:lineorder_flat然後利用單機伺服器進行單表查詢(寬表共包含6億行資料,總共約220GB空間)。此外,按照SSB既定的部分查詢語句,利用單機與叢集分別進行多表查詢(共包含6億行資料,主表佔據約67GB空間)。同時由於MatrixOne對過濾的支援不完善,因此在標準SSB測試SQL中去除了需要帶過濾的SQL語句。

2. 測試流程

SSB測試資料由dbgen命令產生,對資料預處理後使用load data infile命令將資料匯入已建好的MatrixOne資料表中,最後進行相關查詢操作。具體測試流程請參見已釋出的「」檔案。

3. 測試結果

>>>單機單表測試<<<

在單機單表測試中,針對給定的版本,MatrixOne在每個查詢上的執行速度均快於Clickhouse,總查詢時間僅為Clickhouse的65%,結果如下:

單機單表測試 Q2 Q3.1 Q3.2 Q4.1 Q4.2 Q4.3 SUM
MO 0.2.0 2.71 4.23 11.05 2.94 4.27 16.91 42.11

ClickHouse

v21.11.4.14

3.82 5.01 21.34 3.1 5.32 26.32 64.91

 

>>>單機多表測試<<<

在單機多表測試中,針對給定的版本,MatrixOne在每個查詢上的執行速度均快於Clickhouse,在總查詢時間上表現優異,為Clickhouse的50%,結果如下:

單機多表測試 Q2 Q3.1 Q3.2 Q4.1 Q4.2 Q4.3 SUM
MO 0.2.0 13.6 12.94 23.56 13.96 19.72 46.07 129.85

ClickHouse

v21.11.4.14

28.05 27.81 54.84 27.2 41.82 85.99

265.71

四、紐約出租車(NYC)資料測試

紐約市計程車資料集收集了紐約市數十億次計程車出行的詳細資訊,包括接送日期、時間、接送地點、行程距離、詳細票價、費率、支付型別、以及乘客數量(大部分原始資料來自NYC Taxi & Limousine Commission)。

1. 測試概況

使用單機伺服器對NYC資料進行單表查詢(寬表共包含17億行資料,總共約450GB空間)。由於目前MatrixOne對資料表分割區的支援還不完善,因此去掉了Clickhouse中對Partition命令的使用。

2. 測試流程

NYC測試資料目前需要通過PostgreSQL進行下載,並匯入MatrixOne的資料表,整個資料下載及匯入的流程可參考「」以及官方檔案「」。

3. 測試結果

>>>單機單表測試<<<

在NYC資料的單機單表測試中,針對給定的版本,除Q1之外,MatrixOne的執行速度均快於Clickhouse,總查詢時間略少於Clickhouse。具體結果如下:

單機單表測試 Q1 Q2 Q3 Q4 SUM
MO 8.37 2.67 3.48 5.34 19.86
ClickHouse 5.99 4.13 4.56 7.09 21.77

 

五、歡迎加入MatrixOne社群

官網:

原始碼:

Slack:

展開閱讀全文