vivo 網際網路伺服器團隊 - Li Qingxin

C/C++ 開發效率一直被業內開發人員詬病，單元測試開發效率也是如此，以至於開發人員不願花時間來寫單元測試。那麼我們是不是可以通過改善編寫單元測試的效率來提升專案的測試用例覆蓋率？

本文主要介紹如何利用GCC外掛來實現提升C/C++開發者的單元效率工具解決方案，希望對大家在提升單元測試效率上有所啟發。

一、動機

上圖展示了C/C++單元測試的基本流程，在日常開發過程中寫單元測試是一項比較大工程量的事情，C/C++ 目前單元測試程式碼都需要自己手動寫，而且對於一些私有方法打樁就更加麻煩。

目前業內無開源的自動化測試框架或者工具，倒是有一些商業的自動測試工具，下圖展示了我們自動化測試工具及單元測試庫：

即使開源界有gtest等測試庫的支援，我們仍然需要編寫大量的單元測試用例程式碼。對於一些private、protected的類方法，編寫單元測試用例的效率就更低，需要手動打樁（mock)。同時我們分析測試用例發現，存在很多邊界的用例，它們基本上都是很固定或者有一定模式，比如int 最大最小值等。

如何改善編寫單元測試的效率，提升C/C++同學開發效率以及程式質量？我們可以通過提取原始檔中的函數、類等資訊，然後生成對應的單元測試用例。自動生成用例時需要依賴函數的宣告、類的宣告等資訊，那麼我們應該如何獲取這些資訊呢？

例如：如下的函數定義：

void test(int arg) {}

我們希望能夠從上面的函數定義中得到函數的返回值型別、函數名稱、函數引數型別、函數作用域。通常我們可以通過以下幾種方式得到：

1.1 方法1：使用正規表示式

無奈C/C++ 格式比較複雜能夠雖然能夠使用多種組合來獲取對應的函數宣告等資訊：

void test(int arg){}
void test1(template<template<string>> arg,...){}
void test2(int(*func)(int ,float,...),template<template<string>> arg2){}

那麼就需要寫一系列的正規表示式：

提取函數名稱、引數名：[z-aA-Z_][0-9]+
提取函數返回值：^[a-zA-Z_]

關鍵詞提取出來了，但是他有一個很大的問題：怎麼判斷檔案中書寫的程式碼是符合C/C++語法描述呢？

1.2 方法2：使用flex/bison 分析c/c++原始碼檔案

這當然是一種很好的方式，但是工作量巨大，相當於實現一個具備詞法、語法分析器簡易版本的編譯器，而且要適配不同的語法格式，雖然bison可以解決上述的如何判斷語法是否正確問題，但是仍然很複雜。

1.3 方法3：利用編譯已經生成的AST 來生成程式碼

通常我們瞭解到的GCC編譯的過程是以下四個階段：

原始檔->預處理->編譯->組合→連結

但實際上GCC為了支援更多的程式語言、不同的CPU架構做了很多的優化，如下圖所示：

上圖展示了GCC處理原始碼及其他優化過程，在前端部分生成的Generic 語言是gcc編譯過程中為原始碼生成的一種與原始碼語言無關的抽象語法表現形式（AST）。既然GCC編譯過程中生成了AST樹，那麼我們可以通過GCC外掛來提取GCC 前端生成的抽象語法樹關鍵資訊比如函數返回值、函數名稱、引數型別等。總體難度也很高，一方面業內可參考資料很少，只能通過分析GCC的原始碼來分析AST語法樹上的各個節點描述。

本文所描述的自動化生成單元測試用例的解決方案（我們稱之為TU：Translate Unit，後文統稱為TU）就是基於方法3來實現的，下面我們先來看看我們的自動化測試用例解決方案的效果展示。

二、效果展示

2.1 業務程式碼零修改，直接使用TU生成邊界用例

在該用例中我們不需要修改任何業務程式碼就能夠為業務程式碼生成邊界測試用例，而且函數引數可邊界值實現全排列，大大降低用例遺漏風險。大家可能發現這種沒有做任何修改生成的用例是沒有斷言的，雖然沒有斷言，它仍然能夠幫助發現單元是否會存在邊界值引起coredump。

那麼如果想要給他加上斷言、mock函數，是否沒有辦法呢？通過C++11 [[]] 新的屬性語法，只需要在方法宣告或者定義時新增下根據TU的格式新增斷言即可，對業務邏輯無侵入。

2.2 使用註解tu::case生成使用者自定義用例

很多情況下預設生成的邊界測試用例還不能覆蓋到核心邏輯，所以我們也提供tu::case 來給使用者自定義自己的測試用例及斷言。比如有一個int foo （int x,long y) 方法，現在想新增一個測試用例返回值123，函數實參1,1000，那麼只要在函數宣告前加入，以下程式碼即可：

[[tu::case("NE","123","1","1000")]]

2.3 使用註解tu::mock 自動生成mock方法

開發過程中我們也常需要對某個方法進行mock（即對原有方法設定一個臨時代替方法並且呼叫方式保持一致），比如某個函數存取Redis、DB這種情況下進行單元測試往往需要對這些方法進行mock，方便其他函數呼叫進行單元測試，為了方便進行單元測試我們往往會對其進行mock，所以為了方便開發人員進行快速的mock，所以我們提供了tu::mock 的註解幫助開發同學快速的定義註解，然後TU會自動生成對應的mock函數。例如：現在給foo_read 方法mock一個函數，讓mock的函數返回10：