返回值的開銷
1 class Foo {
};
2
3 Foo rbv();
4
5 void yourCode()
6 {
7 Foo x = rbv(); ← the return-value of rbv() goes into x
8 
9 }
上面代碼中有多少個臨時對象?在大多數的商用編譯器中會對其進行優化,對上面的代碼而言,編譯器會做如下的優化:
1 Foo rbv()
2 {
3 
4 return Foo(42, 73); ← suppose Foo has a ctor Foo::Foo(int a, int b)
5 }
編譯器直接返回構造函數,實際上編譯器是通過指針傳遞來達到這個目的。當在代碼調用rbv(),編譯器會產生一個指向本地對象(Foo(42,73)),這里說void*還不如說是Foo*。
1 // Pseudo-code
2 void rbv(void* put_result_here) ← Original C++ code: Foo rbv()
3 {
4 
5 }
6
7 // Pseudo-code
8 void yourCode()
9 {
10 struct Foo x;
11 rbv(&x); ← Original C++ code: Foo x = rbv()
12 
13 }
這里編譯器也把這個技巧用在構造函數中,如下面的例子所示;
1 // Pseudo-code
2 void Foo_ctor(Foo* this, int a, int b) ← Original C++ code: Foo::Foo(int a, int b)
3 {
4 
5 }
事實上編譯做了如下的工作:通過put_result_here來替代構造函數的this指針。
1 // Pseudo-code
2 void rbv(void* put_result_here) ← Original C++ code: Foo rbv()
3 {
4 
5 Foo_ctor((Foo*)put_result_here, 42, 73); ← Original C++ code: return Foo(42,73);
6 return;
7 }
回到第一段代碼,我們通過&x到rbv(),rbv()傳遞x到構造函數(像這個this指針),也就直接構造了x。這種返回值優化會使效率更高,即使不打開編譯器的優化開關,因為它產生的代碼比較少。
一些編譯器還支持回返回值優化來返回本地(局部)變量,還提供所有的函數返回本地(局部)量,但不是所有的編譯器都支持,例如下面的代碼,g++支持而VC不支持。
1 // Actual C++ code for rbv()
2 Foo rbv()
3 {
4 
5 Foo ans = Foo(42, 73);
6 
7 do_something_with(ans);
8 
9 return ans;
10 }
這里編譯器可能會產生一個本地(局部)變量ans,在return時拷貝構造ans通過指向put_result_here(的指針)
并析構, 如果所有的函數都返回一個變量,那么編譯器也支持構造ans通過put_result_here,如下所示
注意這里討論的僅針對返回值,例如:如果Foo x=rbv()改成Foo x;x=rbv(),編譯器會使用賦值操作符,除非提供默認的構造函數,其次這個賦值操作符和要和拷貝構造功能一樣,在return時依然會有臨時量產生,在使用賦值操作符拷貝它,再析構,這里的返回值優化也只是它(臨時量)的一部分,但是如果改成Foo x,x = rbv(),將程序無法防止編譯器消除這個臨時量。