C++中的返回值优化(RVO)

2024-01-09 07:28
文章标签 c++ 优化 返回值 rvo

本文主要是介绍C++中的返回值优化(RVO),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一、命名返回值优化(NRVO)

是Visual C++2005及之后版本支持的优化。

具体来说,就是一个函数的返回值如果是一个对象。那么,正常的返回语句的执行过程是,把这个对象从当前函数的局部作用域,或者叫当前函数的栈空间,拷贝到返回区,使得调用者可以访问。然后程序从当前函数中返回到上一层,即该函数的调用语句处,通过访问返回区的对象,来执行调用语句所在的一整个语句。

当这个函数中所有的返回语句全部是这一个对象的话,那么,命名返回值优化的作用就是,在这个对象建立的时候,直接在返回区建立。这样就使得函数返回时不需要调用拷贝构造函数了,减少了一个对象的创建与销毁过程。

代码如下:

#include <iostream>
using namespace std;class A
{
public:A(){member = 1;cout << "default constructor" << endl;}A(const A &right){member = right.member;cout << "copy constructor" << endl;}~A(){cout << "destructor" << endl;}A& operator = (const A &right){cout << "assigning operator" << endl;return *this;}int member;
};A MyMethod(int n)
{A retVal;retVal.member = n;return retVal;
}int main()
{A valA;valA = MyMethod(10);return 0;
}

在VS2010的命令行下,进行未优化的编译: cl /Od example.cpp(cl编译的优化选项附文末)。执行example.exe,得到输出结果如下图

再次编译,进行优化后的编译: cl /O2 example.cpp ,执行example.exe,得到输出结果如下图

注:NRVO在多层嵌套函数下依然有效。

实验代码:

#include <iostream>
using namespace std;class A
{
public:A(){member = 1;cout << "default constructor" << endl;}A(const A &right){member = right.member;cout << "copy constructor" << endl;}~A(){cout << "destructor" << endl;}A& operator = (const A &right){cout << "assigning operator" << endl;return *this;}int member;
};A f()
{A tmp;return tmp;
}
A MyMethod(int n)
{A tmp = f();return tmp;
}int main()
{A valA;valA = MyMethod(10);return 0;
}

cl /Od结果:

cl /O2结果:

 二、未命名返回值优化

还有一种未命名的返回值优化,是这样做的,在返回语句中直接创建一个临时对象并返回。

实际上,这并不太能算是一种优化,因为在/Od的cl编译下也会进行优化。所以,这里相当于一个高效的编程技巧。

如下代码:

#include <iostream>
using namespace std;class MyClass
{
public:MyClass(){cout << "default constructor at " << this << endl;}MyClass(int a, int b){cout << "normal constructor at " << this << endl;}MyClass(const MyClass &right){cout << "copy constructor at " << this << endl;}~MyClass(){cout << "destructor at " << this << endl;}
};MyClass MyMethod1(int a, int b)
{MyClass tmp1(a, b);MyClass tmp2(b, a);if(a > b){return tmp1;}else{return tmp2;}
}
MyClass MyMethod2(int a, int b)
{if(a > b){return MyClass(a, b);}else{return MyClass(b, a);}
}int main()
{MyClass m;cout << "m at " << &m << endl;m = MyMethod1(1, 2);m = MyMethod2(1, 2);return 0;
}

在MyMethod1中,经历了创建tmp1与tmp2,并根据条件返回某个tmp的过程,不具备前文所述NRVO的条件(所有返回语句都要返回一个相同对象),那么会有两个tmp对象被创建,其中一个会被拷贝到返回区,再返回到函数调用语句。

但如果在返回语句中直接构造MyClass临时对象,如MyMethod2中所示,这样就可以直接将临时对象构造在返回区中,节省了两个对象的创建与销毁的过程。

用不带优化的/Od编译后,执行后结果如下:


注:未命名的返回值优化在多层函数嵌套下依然有效。

实验代码与NRVO如出一辙:

#include <iostream>
using namespace std;class A
{
public:A(){cout << "default constructor" << endl;}A(const A &right){cout << "copy constructor" << endl;}~A(){cout << "destructor" << endl;}A& operator = (const A &right){cout << "assigning operator" << endl;return *this;}
};A f()
{return A();
}
A MyMethod(int n)
{return f();
}int main()
{A valA;valA = MyMethod(10);return 0;
}

cl /Od结果如下:

三、 隐式构造函数优化

当用赋值语句对一个对象进行赋值时,最一般的情况是先执行赋值号右侧的表达式,再将表达式的结果(一般是编译时产生的临时变量)赋值给对象。

然而,当用赋值语句对一个对象进行初始化时,则该表达式的结果就是该对象。即,不需要产生临时变量,而是直接将表达式的结果建立在该对象的位置上。

不是很好表述,代码如下:

#include <iostream>
using namespace std;class A
{
public:A(){cout << "default constructor" << endl;}A(const A &){cout << "copy constructor" << endl;}~A(){cout << "destructor" << endl;}A& operator = (const A &){cout << "operator =" << endl;return *this;}
};A func()
{return A();
}int main()
{A a = func();// A a(func())效果相同return 0;
}

运行结果如图所示:

func函数中,return右边的A()直接是在函数返回区建立的。而这个返回区,在主函数中,就变成了a。所以只需要一个构造函数。

个人的理解是这样的:在栈空间中,调用函数时,会在压入实参之前,留下一个函数返回值的类型的大小那么大的空间,作为函数的返回区。而新建立的变量a,其地址恰恰就在返回区的这个地方,这两者是完全重合的。所以,在函数返回后,无需将函数返回值作为拷贝构造函数的参数去初始化a,而是——什么都不用做。因为a所在的区域,就是函数的返回区域。

然而,当多重函数这样返回的时候,结果还是一样的。这里让我有点费解。代码如下:

#include <iostream>
using namespace std;class A
{
public:A(){cout << "default constructor" << endl;}A(const A &){cout << "copy constructor" << endl;}~A(){cout << "destructor" << endl;}
private:A& operator = (const A &){cout << "operator =" << endl;return *this;}
};A func1()
{return A();
}A func()
{return func1();
}int main()
{A a(func());return 0;
}

运行的结果和上面的是一样的,还是只执行了一次默认构造函数。
问题是,如果函数返回值的返回区确实是在实参之前,与调用者的下一个局部变量的地址是重合的话,那么,a和func()返回区的地址是重合的,可以理解。可func1()的返回区不应该是在func的栈空间中吗?怎么又会和main中的a重合呢?

现在只能理解这么多了。可能只有了解了C++的函数调用约定之后才能明白吧!

附:Visual Studio(2010)的cl优化选项:

这篇关于C++中的返回值优化(RVO)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/586348

相关文章

C++中全局变量和局部变量的区别

《C++中全局变量和局部变量的区别》本文主要介绍了C++中全局变量和局部变量的区别,全局变量和局部变量在作用域和生命周期上有显著的区别,下面就来介绍一下,感兴趣的可以了解一下... 目录一、全局变量定义生命周期存储位置代码示例输出二、局部变量定义生命周期存储位置代码示例输出三、全局变量和局部变量的区别作用域

C++中assign函数的使用

《C++中assign函数的使用》在C++标准模板库中,std::list等容器都提供了assign成员函数,它比操作符更灵活,支持多种初始化方式,下面就来介绍一下assign的用法,具有一定的参考价... 目录​1.assign的基本功能​​语法​2. 具体用法示例​​​(1) 填充n个相同值​​(2)

MySQL深分页进行性能优化的常见方法

《MySQL深分页进行性能优化的常见方法》在Web应用中,分页查询是数据库操作中的常见需求,然而,在面对大型数据集时,深分页(deeppagination)却成为了性能优化的一个挑战,在本文中,我们将... 目录引言:深分页,真的只是“翻页慢”那么简单吗?一、背景介绍二、深分页的性能问题三、业务场景分析四、

Linux进程CPU绑定优化与实践过程

《Linux进程CPU绑定优化与实践过程》Linux支持进程绑定至特定CPU核心,通过sched_setaffinity系统调用和taskset工具实现,优化缓存效率与上下文切换,提升多核计算性能,适... 目录1. 多核处理器及并行计算概念1.1 多核处理器架构概述1.2 并行计算的含义及重要性1.3 并

c++ 类成员变量默认初始值的实现

《c++类成员变量默认初始值的实现》本文主要介绍了c++类成员变量默认初始值,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧... 目录C++类成员变量初始化c++类的变量的初始化在C++中,如果使用类成员变量时未给定其初始值,那么它将被

C++中NULL与nullptr的区别小结

《C++中NULL与nullptr的区别小结》本文介绍了C++编程中NULL与nullptr的区别,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编... 目录C++98空值——NULLC++11空值——nullptr区别对比示例 C++98空值——NUL

C++ Log4cpp跨平台日志库的使用小结

《C++Log4cpp跨平台日志库的使用小结》Log4cpp是c++类库,本文详细介绍了C++日志库log4cpp的使用方法,及设置日志输出格式和优先级,具有一定的参考价值,感兴趣的可以了解一下... 目录一、介绍1. log4cpp的日志方式2.设置日志输出的格式3. 设置日志的输出优先级二、Window

从入门到精通C++11 <chrono> 库特性

《从入门到精通C++11<chrono>库特性》chrono库是C++11中一个非常强大和实用的库,它为时间处理提供了丰富的功能和类型安全的接口,通过本文的介绍,我们了解了chrono库的基本概念... 目录一、引言1.1 为什么需要<chrono>库1.2<chrono>库的基本概念二、时间段(Durat

C++20管道运算符的实现示例

《C++20管道运算符的实现示例》本文简要介绍C++20管道运算符的使用与实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧... 目录标准库的管道运算符使用自己实现类似的管道运算符我们不打算介绍太多,因为它实际属于c++20最为重要的

Visual Studio 2022 编译C++20代码的图文步骤

《VisualStudio2022编译C++20代码的图文步骤》在VisualStudio中启用C++20import功能,需设置语言标准为ISOC++20,开启扫描源查找模块依赖及实验性标... 默认创建Visual Studio桌面控制台项目代码包含C++20的import方法。右键项目的属性: