聊聊 C++ 右值參照 和 移動建構函式

2022-07-25 21:01:07

一: 背景

最近在看 C++ 的右值參照和移動建構函式,感覺這東西一時半會還挺難理解的,可能是沒踩過這方面的坑,所以沒有那麼大的深有體會,不管怎麼說,這一篇我試著聊一下。

二: 右值參照

1. 它到底解決了什麼問題?

在其他程式語言中,很少聽到 右值參照 這個詞,我個人感覺還是 C++ 這個 值型別 優先的語言基因決定的,我們都知道 值型別 作為方法引數或者返回值時會生成自身的副本,如果 值型別 很大,那一來一回生成若干個深複製的 臨時物件 將會產生巨大的效能開銷。

總結一句話:右值參照 就是儘可能的減少這中間 臨時物件 個數,尤其是關聯到 heap 上的物件,僅此而已。

2. 右值參照是個什麼樣子?

說到 右值參照 得先說什麼是 右值,左值左值 一般都是帶有記憶體地址的變數,而 右值 一般是立即數或者運算過程中的臨時物件,這種物件不會有地址值,是不是很繞,我舉個例子吧。


int main()
{
	int i = 10;
	int j = 11;

	int sum = i + j;
}

  1. 10,11,(i+j)

屬於右值,因為它本身沒有記憶體地址,除非把它們放入到棧中或者堆中。

  1. i,j,sum

屬於左值,因為它們是執行緒棧上地址的識別符號。

知道了 左右值 概念,接下來理解 左右值參照 就很簡單了,既然是 參照,必然是多個變數指向同一個地址,對吧,修改下程式碼如下:


int main()
{
	int i = 10;
	int& k = i;		//左值參照


	int&& m = 10;	//右值參照
}

接下來看下組合程式碼:


    33: 	int i = 10;
00FB182F  mov         dword ptr [ebp-0Ch],0Ah  
    34: 	int& k = i;	
00FB182F  mov         dword ptr [ebp-0Ch],0Ah  
00FB1836  lea         eax,[ebp-0Ch]  
00FB1839  mov         dword ptr [ebp-18h],eax  
    36: 	int&& m = 10;	
00FB183C  mov         dword ptr [ebp-30h],0Ah  
00FB1843  lea         eax,[ebp-30h]  
00FB1846  mov         dword ptr [ebp-24h],eax 

從組合程式碼看,它們是一模一樣的,也就是說在組合層面,其實並沒有 右值參照左值參照 一說。

有了這些基礎,我們來看下更復雜的 class 結構。

三: 右值參照如何減少物件的建立

1. 簡要思路

其實仔細想一想,減少臨時物件的建立,無非就是在運算過程中複用一些物件,不需要每次都走賦值建構函式來進行深複製,畫個圖就像下面這樣。

明白了這個思路,接下來我們舉一個例子說明。

2. 一個簡單的例子

C++ 最煩的地方就是有太多的建構函式, 數不勝數,太尷尬了,這裡我做一個簡單的 + 操作例子。



#include <iostream>
#include <vector>

using namespace std;

class StringBuidler {
public:
	char* str;
	int length;
public:
	StringBuidler() {}
	StringBuidler(int len, char c) {
		this->str = new char[len];
		this->str[0] = c;
		this->length = len;
	}

	StringBuidler(const StringBuidler& s) {

		printf("StringBuidler:深複製 \n");
		this->length = s.length;
		this->str = new char[s.length];

		for (size_t i = 0; i < length; i++)
		{
			this->str[i] = s.str[i];
		}
	}

	StringBuidler operator+(const StringBuidler& p) {

		StringBuidler tmp;

		tmp.length = this->length + p.length;
		tmp.str = new char[tmp.length];

		int index = 0;

		for (size_t i = 0; i < this->length; i++)
		{
			tmp.str[index++] = this->str[i];
		}
		for (size_t i = 0; i < p.length; i++)
		{
			tmp.str[index++] = p.str[i];
		}

		return tmp;
	}
};

int main()
{
	StringBuidler s1(10, 'a');
	StringBuidler s2(5, 'b');

	StringBuidler s3 = s1 + s2;

	printf("s3.length=%d, s1.length=%d, s2.length=%d \n", s3.length, s1.length, s2.length);
}

從這個例子中可以看到,s1+s2 操作中出現了一次 深copy,具體程式碼出現在 return 處,組合程式碼如下:

因為是深複製,所以會再次生成一個 new char[] ,如果 new char[] 很大,那將會是不必要的效能開銷,能不能像我畫的圖一樣,將 s3 中的 str 指標直接指向 tmp 所持有的 heap 上的 char[] 陣列來達到複用目的呢? 肯定是可以的。

3. 效能優化方案

這裡需要用 右值參照 + 移動建構函式s3.str 指向 tmp.str,從而避免複製建構函式,在 StringBuilder 類中加一個方法如下:


	StringBuidler(StringBuidler&& s) {
		this->str = s.str;
		this->length = s.length;

		s.str = nullptr;
	}

然後把程式跑起來,截圖如下:

可以看到,深複製已經沒有了,這個過程會在 return 處被呼叫,編譯器會判斷如果是右值的話,自動走 移動建構函式,沒有這個函數就會走 賦值建構函式

四: 總結

總之 右值參照 可以讓你儘可能的複用一些中間物件,達到一個效能上的提升,其實對 C# 程式設計師來說,這麼簡單的參照賦值,C++ 搞出了這麼多概念,真的很難理解,可能還是那句話,這是 C++ 的值型別優先的基因決定的。