5.1 "无继承"情况下的对象构造

考虑以下这个程序片段:

1	Point global;
2
3 Point foobar()
4 {
5 Point local;
6 Point *heap = new Point;
7 *heap = local;
8 // ... stuff ...
9 delete heap;
10 return local;
11 }

L1,L5,L6表现出三种不同的对象产生方式:global内存配置,local内存配置和heap内存配置.L7把一个 class object指定给还有一个,L10设定返回值,L9则明白地以 delete 运算符删除heap object.

    一个object的生命是,该object的一个运行周期,local object的生命从L5的定义開始,到L10为止.global object的生命和整个程序的生命同样.heap
object的生命从它被 new 运算符配置出来開始,到它被 delete 运算符摧毁为止.


    以下是Point的第一次声明,能够写成C程序.C++ Standard说这是一种所谓的Plain Of Data声明形式:

typedef struct {
float x, y, z;
} Point;

假设以C++来编译这段码,会发生什么事情?观念上,编译器会为Point声明一个trivial default constructor,一个trivial destructor,一个trivial copy constructor,以及一个trivial copy assignment operator.但实际上编译器会分析整个声明,并为它贴上Plain Of Data标签.

    当编译器遇到这种定义:

1 Point global;

时,观念上Point的trivial constructor和destructor都会被产生并被调用,constructor在程序起始(startup)处被调用而destructor在程序的exit()处被调用(exit()由系统产生,放在main()结束之前).然而,其实那些trivial members要不是没被定义,就是没被调用,程序的行为一如它在C中的表现一样.

    在C中,global被视为一个"暂时性的定义",由于它没有明白的初始化操作,一个"暂时性的定义"能够在程序中发生多次.那些实例会被链接器折叠起来,仅仅留下单独一个实体,被放在程序data segment中一个"特别保留给为初始化的global objects使用"的空间.

    C++并不支持"暂时性的定义",这是由于 class 构造行为的隐含应用的缘故.global在C++中被视为全然定义.C++中全部全局对象都被当作"初始化过的数据"来对待.

    foobar()函数中的L5,有一个Point object local,相同也是既没有被构造也没有被解构.Point object local假设没有先经过初始化,可能会成为潜在的程序bug——万一第一次使用它就须要其初始值的话(如L7).至于heap object在L6的初始化操作:

Point *heap = new Point;

会被转换为对 new 运算符(由library提供)的调用:

Point *heap = __new(sizeof(Point));

再一次强调,并没有default constructor施行于 new 运算符所传回的Point object上.L7对此object有一个赋值(赋值,assign)操作,假设local曾被适当地初始化过,一切就没有问题.

7 *heap = local;

其实这一行会产生编译器警告例如以下:

warning,line 7: local is used before being initialized.

观念上,这种指定操作会触发trivial copy assignment operator进行拷贝搬运操作.然而实际上此object是一个Plain Of Data,所以赋值操作(assignment)将仅仅是像C那样的纯粹位搬运操作,L9运行一个 delete 操作:

9 delete heap;

会被转换为对 delete 运算符(由libraray提供)的调用:

__delete(heap);

观念上,这种操作会触发Point的trivial destructor.但destructor要不是没有被产生就是没有被调用.最后,函数以传值(by value)的方式将local当作返回值传回,这在观念上会触发trivial copy constructor,只是实际上 extern 操作仅仅是一个简单的位拷贝操作,由于对象是一个Plain Of Data.

抽象数据类型 (Abstract Data Type)

下面是Point的第二次声明,在 public 接口下多了 private 数据,提供完整的封装性,但没有提供不论什么 virtual function:

class Point {
public:
Point(float x = 0.0, float y = 0.0 float z = 0.0)
: _x(x), _y(y), _z(z) {}
// no copy constructor, copy operator or destructor defined ...
private:
float _x, _y, _z;
};

这个经过封装的Point class,其大小并没有改变,还是三个连续的float,是的,不论 private,public 存取层,或是member function的声明,都不会占用额外的对象空间.

    没有为Point定义一个copy constructor或copy operator,由于默认的位语意(default bitwise semantics,第二章51页)已经足够了.也不须要提供一个destructor,由于程序默认的内存管理方法也足够.

    对于一个global实体:

Point global;		// 实施Point::Point(0.0, 0.0, 0.0);

如今有了default constructor作用于其上,因为global被定义在全局范畴中,其初始化操作将延迟到程序激活(startup)时才開始(详见6.1节)

    假设要对 class 中的全部成员都设定常量初值,那么给予一个 explicit initialization list会比較高效.甚至在local scope中也是如此.举个样例,考虑以下这个程序片段:

void mumble() {
Point local1 = {1.0, 1.0, 1.0};
Point local2;
// 相当于一个inline expansion
// explicit initialization 会略微快一些
local2._x = 1.0;
local2._y = 1.0;
local2._z = 1.0;
}

local1的初始化操作会比local2的高效,由于当函数的activation recored被放进程序堆栈时,上述initialization list中的常量就能够被放进local1内存中.

    explicit initialization list带来三项缺点:

    1.仅仅有当 class members都是 public 时,此方法才奏效.

    2.仅仅能指定常量,由于它们在编译时期就能够被评估求值.

    3.因为编译器并没有自己主动施行,所以初始化行为的失败可能会比較高一些.

    explicit initialization list所带来的效率长处可以补偿其软件project上的缺点吗?



    一般而言,答案是no.然而在某些特殊情况下又不一样.比如,也许以手工打造了一些巨大的数据结构如调色盘,或者正要把一堆常量数据倾倒给程序,那么explicit initialization list的效率会比 inline constructor好的多,特别是对全局对象而言.

    在编译器层面,会有一个优化机制用来识别 inline constructor,后者简单地提供一个member-by-member的常量指定操作,然后编译器会抽取那些值,而且对待它们就好像是 explicit initialization list所供应的一样,而不会把constructor扩展成一系列的assignment指令.

    于是,local Point object的定义:

{
Point local;
}

如今被附加上default Point constructor的 inline expansion:

{
// inline expansion of default constructor
Point local;
local._x = 0.0;local._y = 0.0;local._z = 0.0;
}

L6配置出一个heap Point object:

6	Point *heap = new Point;

如今则被附加一个"对default Point constructor的有条件调用操作":

Point *heap = __new(sizeof(Point));
if (heap != 0)
heap->Point::Point();

然后才又被编译器进行 inline expansion操作,至于把heap指针指向local object:

7	*heap = local;

则保持这简单的位拷贝操作,以传值方式传回local object,情况也是一样:

10	return local;

L9删除heap所指的对象:

9	delete heap;

该操作并不会导致destructor被调用,由于并没有明白地提供一个destructor函数实体.

    观念上,Point class 有一个相关的default copy constructor,copy operator和destructor,然而它们都是无关紧要的,并且编译器实际上根本没有产生它们.

为继承做准备

第三个Point声明,将为"继承性质"以及某些操作的动态决议(dynamic resolution)做准备,当限制对z成员进行存取操作:

class Point {
public:
Point(float x = 0.0, float y = 0.0) : _x(x), _y(y) {}
// no destructor, copy constructor, or copy operator defined ...
virtual float z();
protected:
float _x, _y;
};

再一次强调,并未定义一个copy constructor,copy operator,destructor.全部的members都以数值来存取,因此在程序层面的默认语意的下,行为良好.

    virtual functions的导入促使每个Point object拥有一个 virtual table Pointer.这个指针提供 virtual 接口的弹性,代价是:每个object须要一个额外的一个word空间.有什么重大影响吗?视应用情况而定!必须视它对多态设计所带来的实际效益的比例而定.

    除了每个 class object多负担一个vptr之外,virtual function的引入也引发编译器对Point class 产生膨胀作用:

    定义的constructor被附加了一些码,以便将vptr初始化.这些码必须被附加在不论什么base class constructor的调用之后,但必须在不论什么由使用者(程序猿)供应的代码之前.比如,以下就是可能的附加结果:

Point *Point::Point(Point *this, float x, float y) : _x(x), _y(y) {
// 设定object的virtual table pointer(vptr)
this->__vptr_point = __vtbl__point;
// 扩展member initialization list
this->_x = x;
this->_y = y;
// 传回this对象
return this;
}

合成一个copy constructor和一个copy assignment operator,并且其操作不再是trivial(但implicit destructor仍然是trivial).假设一个Point object被初始化或以一个derived class object赋值,那么以位为基础(bitwise)操作可能给vptr带来非法设定.

// copy constructor的内部合成
inline Point* Point::Point(Point *this, const Point &rhs) {
// 设定object的virtual table pointer(vptr)
this->__vptr_Point = __vtbl__Point;
// 将rhs坐标中的连续位复制到this对象,或是经由member assignment提供一个member ...
return this;
}

编译器在优化状态可能会把object的连续内容复制到还有一个object上,而不会实现一个精确地"以成员为基础"的赋值操作.C++ Standard要求编译器尽量延迟nontrivial memebrs的实际合成操作,直到真正遇到其使用场合为止.

1	Point global;
2
3 Point foobar()
4 {
5 Point local;
6 Point *heap = new Point;
7 *heap = local;
8 // ... stuff ...
9 delete heap;
10 return local;
11 }

L1的global初始化操作,L6的heap初始化操作以及L9的heap删除操作,都还是和稍早的Point版本号同样,然而L7的memberwise赋值操作:

*heap = local;

非常可能触发copy assignment operator的合成,以及其调用操作的一个 inline expansion(内部扩展);以 this 代替heap而以rhs代替local.

    最戏剧性的冲击发生在以传值方式传回local的那一行(L10).因为copy constructor的出现,foobar()非常可能被转化为以下这样(详见2.3节):

// C++伪代码:foobar()的转化,用以支持copy constructor
Point foobar(Point &__result) {
Point local;
local.Point::Point(0.0, 0.0);
// heap的部分与前面同样...
// copy constructor的应用
__result.Point::Point(local);
// local对象的destructor将在这里运行调用Point定义的destructor:local.Point::~Point();
return;
}

假设支持named return value(NRV)优化,这个函数会进一步被转化为:

// C++伪代码:foobar()的转化
// 以支持named return value(NRV)优化
Point foobar(Point &__result) {
__result.Point::Point(0.0, 0.0);
// heap的部分与前面同样...
return;
}
    一般而言,假设设计中有很多函数都须要以传值方式(by value)传回一个local class object,比如像例如以下形式的一个算数运算:
</pre><pre name="code" class="cpp">T operator+(const T &, const T &) {
T result;
// ...真正的工作在此
return result;
}

那么提供一个copy constructor就比較合理--甚至即使default memberwise语意已经足够.它的出现会触发NRV优化.然而,就像前一个样例中所展现的那样,NRV优化后将不再须要调用copy constructor,由于运算结果已经被直接置于"将被传回的object"体内了.

05-11 22:42