"你真的清楚构造函数,拷贝构造函数,operator=,析构函数都做了什么吗? 它们什么时候被调用?",这些问题可不是面向初菜的问题,对于老鸟而言,甚至对于许多自诩为老手的人而言,倒在这上面也是很正常的。因为这个问题的答案不但考察我们对于C++语言的理解,而且答案是和编译器的实现有关的!
【第一题】以下代码,main函数中G.i的打印结果是什么? 写在一张纸上,再看答案。我不是在挑战大家的知识,我是在挑战很多人的常识。
- #include<iostream>
- using namespace std;
- class G
- {
- public:
- static int i;
- G() {cout<<"ctor"<<endl;i+=1;}
- G(const G& rg){cout<<"copy ctor"<<endl;i+=2;}
- G& operator=(const G& rg){cout<<__FUNCTION__<<endl;i+=3;return *this;}
- };
- int G::i=0;
- G Create()
- {
- cout<<__FUNCTION__<<" starts"<<endl;
- G obj;
- cout<<__FUNCTION__<<" ends"<<endl;
- return obj;
- }
- int main(int argc, char* argv[])
- {
- G g1=Create();
- cout<<"G.i="<<G::i<<endl;
- return 0;
- }
"3,2,1,公布答案"。G.i是多少? 回答4及其以上的统统枪毙。回答3及其以下的留下继续讨论。注意,这里根本就没有调用到operator=,因为operator=被调用的前提是一个对象已经存在,我们再次给它赋值,调用的才是operator=。
那么答案到底是多少呢? VC编译器,用2008或者2012,Debug版都是3,Release版都是1。用GCC4.7,Debug/Release都是1。
为什么? 因为G g1=Create();这句话,可能会触发C++编译器的一个实现特性,叫做NRVO,命名返回值优化。也就是G函数中的obj并没有被创建在G的调用栈中,而是调用Create()函数的main的栈当中,因此obj不再是一个函数的返回变量,而是用g1给Create()返回的变量命名。
这就带了一个问题,如果用VC编程的话,HouseKeep/计数的信息如果在ctor/copy ctor里面,那么不能保证调试版和发布版的行为一致。这个坑太大了。但是GCC没有这个问题!瞬间对理查德-斯托曼无比敬仰。
- #include <vector>
- #include <iostream>
- using namespace std;
- struct Noisy {
- Noisy() {std::cout << "constructed\n"; }
- Noisy(const Noisy&) { std::cout << "copied\n"; }
- ~Noisy() {std::cout << "destructed\n"; }
- };
- std::vector<Noisy> f()
- {
- std::vector<Noisy> v = std::vector<Noisy>(2); // copy elision from temporary to v
- return v; // NRVO from v to the nameless temporary that is returned
- }
- void fn_by_val(std::vector<Noisy> arg) // copied
- {
- std::cout << "arg.size() = " << arg.size() << '\n';
- }
- void main()
- {
- std::vector<Noisy> v = f(); // copy elision from returned temporary to v
- cout<<"------------------before"<<endl;
- fn_by_val(f());// and from temporary to the argument of fn_by_val()
- cout<<"------------------after"<<endl;
- }
第一轮没有被枪毙的同学注意了: 这道题目的答案仍然是和编译器有关的,而且和版本还有关系。
(2.1) VC2008 Debug版的运行结果
- constructed
- copied
- copied
- destructed
- copied
- copied
- destructed
- destructed
- ------------------before
- constructed
- copied
- copied
- destructed
- copied
- copied
- destructed
- destructed
- arg.size() = 2
- destructed
- destructed
- ------------------after
- destructed
- destructed
- Press any key to continue . . .
看到了吗,在"------------before"之前,有一个奇怪的ctor, copy ctor, copy ctor, dtor的调用序列? 这是VC2008当中std::vector<Noisy>(2)做的事情: 先调用一个默认构造函数构造Noisy临时对象,然后把临时对象拷贝给vector<Noisy>的两个程序,再把临时对象析构掉。太傻了吧!Release版的结果稍微好一点,返回的vector不再被拷贝了,就如同第一题所说的:
(2.2) VC2008 Release版的运行结果
- constructed
- copied
- copied
- destructed
- ------------------before
- constructed
- copied
- copied
- destructed
- arg.size() = 2
- destructed
- destructed
- ------------------after
- destructed
- destructed
- Press any key to continue . . .
- constructed
- constructed
- ------------------before
- constructed
- constructed
- arg.size() = 2
- destructed
- destructed
- ------------------after
- destructed
- destructed
- Press any key to continue . . .
调用了两次ctorl来构造这个vector。性能提高多了。慢点,还有一点不同,因为函数fn_by_val的参数是传值而不是传引用,所以编译器知道在这个函数里面vector没有被修改,因此直接把传值优化成了传const&! VC2012的Debug/Release一致!终于赶上GCC了,不容易。
问题:到底什么时候一个拷贝构造的操作可以被优化掉呢? C++标准还是有定义的,这个网页说的很清楚(http://en.cppreference.com/w/cpp/language/copy_elision)。其中的Notes一段话非常重要,我贴到这里:
Copy elision is the only allowed form of optimization that can change the observable side-effects. Because some compilers do not perform copy elision in every situation where it is allowed, programs that rely on the side-effects of copy/move constructors and destructors are not portable.
Even when copy elision takes place and the copy-/move-constructor is not called, it must be present and accessible, otherwise the program is ill-formed.
也就是说,编译器即使知道ctor/copy ctor/move ctor/dtor有副作用,也会考虑消除拷贝。当然,其他的编译器优化是不能消除副作用的。其他的Copy elision的情况有举例如下。
- struct My {
- My() {std::cout << "constructed\n"; }
- My(const My&) { std::cout << "copied\n"; }
- ~My() {std::cout << "destructed\n"; }
- };
- void f(My m){}
- void main()
- {
- f(My());
- }
- constructed
- destructed
- Press any key to continue . . .
看起来,临时变量My()被优化成了一个const My&并传递了进去,当作了f的参数。
- struct My {
- My() {std::cout << "constructed\n"; }
- My(const My&) { std::cout << "copied\n"; }
- ~My() {std::cout << "destructed\n"; }
- };
- void fm(){throw My();}
- void main()
- {
- try{
- cout<<"before throw"<<endl;
- fm();
- cout<<"after throw"<<endl;
- }catch(My& m)
- {}
- }
这里的throw My()语句构造的My对象,优化后是构造在try的栈上面而非fm的栈上面,因此没有copy ctor的调用。
- using namespace std;
- struct C4
- {
- void f(){throw 1;}
- ~C4(){throw 2;}
- };
- int main(size_t argc, char* argv[])
- {
- try
- {
- try
- {
- C4 obj;
- obj.f();
- }catch(int i)
- {
- cout<<i<<endl;
- }
- }catch(int i)
- {
- cout<<i<<endl;
- }
- return 0;
- }
到底是打印1还是打印2还是两个都打印?不要翻书了,这个程序运行起来,什么都不打印,直接崩溃了。用VC2008/VC2012/GCC4.7的Debug/Release都验证过了。原因呢? 和C++编译器的异常传递链条的"实现"有关,展开来解释能有几十页。能答对这道题并说出原因的面试者应该是高级以上水平,可以直接录用,别的都不用看了。
以上几个题目真的会成为面试题吗? 基本不会,面试官能答上来的也寥寥。来个测试,
填空: 用VC2008或者VC2012编译下面的代码,Release版,
My::My(const My&)调用了___次
My& My::operator(const My&)调用了___次
- #include<iostream>
- using namespace std;
- class My{
- public:
- My() {cout<<"ctor"<<endl;}
- My(const My&){cout<<"copy ctor"<<endl;}
- My& operator=(const My&){
- cout<<"operator="<<endl;
- return *this;
- }
- ~My(){cout<<"dtor"<<endl;}
- };
- My f(){
- My obj;
- return obj;
- }
- int main(void){
- My obj1;
- My obj2=obj1;
- My obj3=f();
- return 0;
- }