本文摘自: http://adamcavendish.is-programmer.com/posts/38190.htm

引言

众所周知,C++11 的新特性中有一个非常重要的特性,那就是 rvalue reference,右值引用。
引入它的一个非常重要的原因是因为在 C++ 中,常常右值,通俗地讲"在等号右边的"临时变量或者临时对象,我们是无法得到它的修改权限的。

由于类的构造和析构机制,往往产生的临时变量或临时对象的拷贝构造及析构,会带来不少的时间、资源消耗。
也同样由于这样的限制,有不少 C++ 程序员依然保有一部分 C 风格的写法,例如将 A = factory(B,
C); 之中的A,以函数引用参数的形式传入等等。但在 C++11 之后,我们可以完全保留 C++ 的写法,将右值明显指出,就可以完成 "直接获得临时对象" 的资源的权限,例如 A = std::move(B); 或者 A = factory(B,
C); ,这时候就 "几乎完全" 省去了拷贝的过程,通过直接获取由 factory(B,
C); 造出的临时对象中的资源,达到省略拷贝的过程,最终析构的临时对象,实际上只是一具空空的皮囊。

以下有一个简单的右值引用的例子:(注,本文中的例子仅仅只是例子,请大家不要使用这种风格)

/**
* Please use g++ -std=c++0x or g++ -std=c++11 to compile.
*/
#include <iostream>
#include <string>
#include <cstring> template <typename T, std::size_t Num>
class Array
{
public:
T * _M_data; Array() :
_M_data(new T[Num])
{} // default constructor Array(const Array & rhs) :
_M_data(new T[Num])
{
std::cout << "Copy Constructor." << std::endl;
memcpy(_M_data, rhs._M_data, sizeof(T)*Num);
} // copy constructor // Move constructor -- from rvalue
Array(Array && rhs) :
_M_data(rhs._M_data)
{
std::cout << "Move Constructor." << std::endl;
rhs._M_data = nullptr;
} // move constructor Array & operator=(const Array & rhs) {
std::cout << "Copy Assignment." << std::endl;
if (this == &rhs)
return (*this);
memcpy(_M_data, rhs._M_data, sizeof(T)*Num);
return (*this);
} // copy assignment // Move Assignment -- from rvalue
Array & operator=(Array && rhs) {
std::cout << "Move Assignment." << std::endl;
if (this == &rhs)
return (*this); _M_data = rhs._M_data;
rhs._M_data = nullptr;
return (*this);
} // move assignment ~Array()
{
std::cout << "destructor." << std::endl;
delete[] _M_data;
} // destructor static Array factory(const T & __default_val) {
Array __ret;
for (auto __i = 0ul; __i < Num; ++__i)
__ret._M_data[__i] = __default_val;
return __ret;
} // factor(defalt_value) void print(const std::string & __info) const {
std::cout << __info;
if (_M_data == nullptr) {
std::cout << "_M_data is nullptr." << std::endl;
return;
} for(auto __i = 0ul; __i < Num; ++__i)
std::cout << _M_data[__i] << ' ';
std::cout << std::endl;
}
}; int main()
{
const std::size_t NUM = 10ul; Array<int, NUM> a0;
for (auto __i = 0ul; __i < NUM; ++__i)
a0._M_data[__i] = __i;
a0.print("a0: "); Array<int, NUM> a1(a0);
a0.print("a0: ");
a1.print("a1: "); Array<int, NUM> a2(std::move(a1));
a1.print("a1: ");
a2.print("a2: "); Array<int, NUM> a3;
a3.print("a3(uninitialized): ");
a3 = a2;
a3.print("a3: ");
a3 = Array<int, NUM>::factory();
a3.print("a3: "); std::cout << "----------" << std::endl;
return ;
}

模拟原理介绍

01. 屏蔽普通的 copy assignment

由于我们要使用 C++03 的特性模拟右值引用 (rvalue-reference) ,所以最重要的就是要先获得对临时对象的访问权限。
故优先考虑的是
   
a3 = Array<int, NUM>::factory(1024);

的实现。

我们考虑我们平时代码中的 operator = 的重载函数,一般 C++03 中处理以上这句代码的,是使用 Array & opeartor =(const Array & rhs); 函数的,即我们平常说的 copy assign operation 。

同时,由于 factory(1024); 返回的是一个Array,当它是临时对象时,它不能被修改,所以不能绑定到Array &类型,而只能绑定到 const Array & 类型上。如果我们要简单屏蔽普通的 copy assignment ,那么最方便的,就是直接去除 Array & operator =(const Array & rhs); 函数。

在去除那个函数之后,你发现你的编译失败了。这就对了 :)

以下为编译失败的代码:

#include <iostream>
#include <string>
#include <cstring> template <typename T, std::size_t Num>
class Array
{
public:
T * _M_data; Array() :
_M_data(new T[Num])
{} // default constructor Array(const Array & rhs) :
_M_data(new T[Num])
{
std::cout << "Copy Constructor." << std::endl;
memcpy(_M_data, rhs._M_data, sizeof(T)*Num);
} // copy constructor private: // Use private to block/disable default functions generated by c++
Array & operator =(const Array & rhs) {
std::cout << "Copy Assignment." << std::endl;
if (this == &rhs)
return (*this);
memcpy(_M_data, rhs._M_data, sizeof(T)*Num);
return (*this);
} // copy assignment
public: ~Array() {
std::cout << "destructor." << std::endl;
delete[] _M_data;
} // destructor static Array factory(const T & __default_val) {
Array __ret;
for (std::size_t __i = 0ul; __i < Num; ++__i)
__ret._M_data[__i] = __default_val;
return __ret;
} // factor(defalt_value) void print(const std::string & __info) const {
std::cout << __info;
if (_M_data == NULL) {
std::cout << "_M_data is nullptr." << std::endl;
return;
} for (std::size_t __i = 0ul; __i < Num; ++__i)
std::cout << _M_data[__i] << ' ';
std::cout << std::endl;
}
}; int main()
{
const std::size_t NUM = 10ul; Array<int, NUM> a0;
for (std::size_t __i = 0ul; __i < NUM; ++__i)
a0._M_data[__i] = __i;
a0.print("a0: "); Array<int, NUM> a1(a0);
a0.print("a0: ");
a1.print("a1: "); Array<int, NUM> a3;
a3.print("a3(uninitialized): ");
a3 = Array<int, NUM>::factory();
a3.print("a3: "); std::cout << "----------" << std::endl;
return ;
}

02. 获得临时对象的访问权限

由于我们无法直接对临时对象进行更改,所以在不改变函数 factory() 的情况下(改了函数就没有意义了),我们只能将其转换为另一个对象类型。这时候我们就要使用 conversion operator/cast operator 了,将其转换成我们可以具有修改权限的类型 -- 例如opeartor T &()。

03. 封装通用conversion类

由于我们需要02中所述的具有可修改性的T类型,这个类型的基本要求如下:

a. 拥有被转换类型的所有成员变量和成员函数,能够自由支配类型中的任意资源
b. 没有时间和空间上的性能损耗
c. 通用性,即不需要为每一个类都重写这个T类型

所以,鉴于此,我们需要使用泛型、继承这两个非常重要的工具。

template <typename T>
class rv : public T
{
public:
rv() {};
rv(const rv & rhs) {};
~rv() {};
void operator =(const rv & rhs) {};
}; // class rv

至此,我们就可以通过撰写 Array & operator =(rv<Array> & rhs); 函数来完成我们的 move assignment 了。不过在转换与函数调用之间还差几小步。

04. 提供 move constructor 和 move assignment 接口(这里是机理最重要的部分)

这里要做的是,在我们的 Array 类内提供 move constructor 和 move assignment 的接口。

A:
希望:a = factory(); 时能够产生隐式转换,自动转换到 rv<Array> 类型。便于捕捉资源,区分 a = factory(); 和 a = a0; 之间的差别。
做法:提供 conversion opeartor 。

// conversion operator -- convert to "rv<Array> &"
// conversion operator rv<Array> &()
operator rv<Array> &()
{
return *(static_cast<rv<Array> *>(this));
} // When the factory returns a const object
// conversion operator const rv<Array> &()
operator const rv<Array> &() const
{
return *(static_cast<const rv<Array> *>(this));
}

B:
希望:a = factory(); 时调用的是 Array & operator =(rv<Array> & rhs); 接口。
做法:将原本设定为 private 的用于屏蔽 a = factory(); 的接口 Array & opeartor =(const Array
& rhs); 改写为用于间接调用 Array & operator =(rv<Array> &
rhs); 接口的方式。

// Lead to the correct move assignment emulation operator
// operator =(const Array & rhs)
Array & operator =(const Array & rhs) {
this->operator =(static_cast< rv<Array> & >(
const_cast< Array & >(rhs)));
return (*this);
}

C:
希望:区分 a = factory(); 和 a = a0; 的调用方式。分别调用模拟的 move assignment 和模拟的 copy assignment 。
做法:由于 a = a0; 既可以匹配 operator =(const Array & rhs) 又可以匹配 operator =(Array
& rhs) ,所以只需要分别撰写两个函数就可以达到区分的目的。另外,因为原本标准的 copy assignment 已经被使用作为 move
assignment 函数的跳板,即上面B解决的问题,所以我们需要重写一个用于 copy assignment 。

// Lead to the correct copy assignment emulation operator
// operator =(Array & rhs)
Array & operator =(Array & rhs) {
this->operator =(static_cast<const rv<Array> &>(
const_cast<const Array &>(rhs)));
return (*this);
}
// Copy Assignment -- emulated.
// copy assignment operator =(const rv & rhs)
Array & operator =(const rv<Array> & rhs) {
std::cout << "Copy Assignment." << std::endl;
if (this == &rhs)
return (*this);
memcpy(_M_data, rhs._M_data, sizeof(T) * Num);
return (*this);
}

我简单总结比较了一下 C++11 和 C++03 两个之间写法的差别:

C++11 的实现:

/**
* Standard c++11 style.
*/
// Move constructor -- from rvalue
Array(Array && rhs) :
_M_data(rhs._M_data)
{
std::cout << "Move Constructor." << std::endl;
rhs._M_data = nullptr;
} // move constructor Array & operator =(const Array & rhs) {
std::cout << "Copy Assignment." << std::endl;
if (this == &rhs)
return (*this);
memcpy(_M_data, rhs._M_data, sizeof(T) * Num);
return (*this);
} // copy assignment // Move Assignment -- from rvalue
Array & operator =(Array && rhs)
{
std::cout << "Move Assignment." << std::endl;
if (this == &rhs)
return (*this); _M_data = rhs._M_data;
rhs._M_data = nullptr;
return (*this);
} // move assignment

C++03 的实现:

/**
* Emulated rvalue-style
*/
// Lead to the correct copy assignment emulation operator
Array & operator =(Array & rhs) {
this->operator =(static_cast< const rv<Array> & >(
const_cast<const Array &>(rhs)));
return (*this);
} // operato r=(Array & rhs) // Lead to the correct move assignment emulation operator
Array & operator =(const Array & rhs) {
this->operator =(static_cast< rv<Array> & >(
const_cast<Array &>(rhs)));
return (*this);
} // operator =(const Array & rhs) // conversion operator -- convert to "rv<Array> &"
operator rv<Array> &() {
return *(static_cast< rv<Array> * >(this));
} // conversion operator rv<Array> &() // ------------------------------ // Move constructor -- emulated.
Array(rv<Array> & rhs) :
_M_data(rhs._M_data)
{
std::cout << "Move Constructor." << std::endl;
rhs._M_data = NULL;
} // move constructor // Copy Assignment -- emulated.
Array & operator =(const rv<Array><array> & rhs) {
std::cout << "Copy Assignment." << std::endl;
if (this == &rhs)
return (*this);
memcpy(_M_data, rhs._M_data, sizeof(T)*Num);
return (*this);
} // copy assignment operator =(const rv<Array><array> & rhs) // Move Assignment -- emulated.
Array & operator =(rv<Array> & rhs) {
std::cout << "Move Assignment." << std::endl;
if (this == &rhs)
return (*this);
_M_data = rhs._M_data;
rhs._M_data = NULL;
return (*this);
} // move assignment

05. std::move的实现

在完成我们的任务之前,我们最后还需要一个函数能够将左值转换成右值,以替代std::move()函数。
由于我们需要这个函数能适配所有的类型,所以它依然要使用泛型~

/**
* @brief std::move Implementations
*/
template <typename T>
inline rv<T> & move_emu(T & rhs) {
return *(static_cast< rv<T> * >(&rhs));
} // move_emu(T &)

然而,单单使用 T & 作为参数是不够的。因为:

a. 如果传入的对象本身是右值,即本身是 rv<T> 类型,我们应该返回的是它本身,而不应该返回为 rv< rv<T> > 类型。
b. 如果传入的对象本身是 cons t保护的,我们不应该夺取它的资源。我们应该按照 std::move 的标准,调用 copy assignment 或者 copy constructor 。
   (这样的意义常常在于写泛型的时候使用 std::move(T) ,我们并不知情 T 是什么类型,当为 const 的时候调用 copy functions 即可)
c. 我们还需要对每一个基本数据类型进行模板特化,例如 template <> inline int move_emu(int rhs) { return rhs; } 。(这个是体力活了 :) 自己做咯~)

/**
* @brief used for std::move(const values);
* -- call copy construction/assignment
*/
template <typename T>
inline const T & move_emu(const T & rhs) {
return rhs;
} // move_emu(const T &) template <typename T>
inline rv<T> & move_emu(rv<T> & rhs) {
return rhs;
} // move_emu(rv<T> &)

上面要写的 rv<T> 和 move_emu 以及 helper functions 都是具有一定的通用性。所以我们完全可以写在一个文件中,作为头文件包含进来即可:

/**
* @file move_emu.hpp
*/
#pragma once template <typename T>
class rv : public T
{
rv() {};
rv(const rv & rhs) {};
~rv() {};
void operator =(const rv & rhs) {};
}; template <typename T>
inline rv<T> & move_emu(T & rhs) {
return *(static_cast< rv<T> * >(&rhs));
} /**
* @brief used for std::move(const values);
* -- call copy construction/assignment
*/
template <typename T>
inline const T & move_emu(const T & rhs) {
return rhs;
} template <typename T>
inline rv<T> & move_emu(rv<T> & rhs) {
return rhs;
} #define COPYABLE_AND_MOVABLE(TYPE) \
public: \
TYPE & operator =(TYPE & t) \
{ this->operator =(static_cast<const rv<TYPE> &>(const_cast<const TYPE &>(t))); return *this;} \
public: \
operator rv<TYPE> &() \
{ return *static_cast< rv<TYPE> * >(this); } \
operator const rv<TYPE> &() const \
{ return *static_cast<const rv<TYPE> * >(this); } \
private: \
// #define COPY_ASSIGN_REF(TYPE) \
const rv< TYPE > & \
// #define RV_REF(TYPE) \
rv< TYPE > & \
//

这时候你在类中就可以直接使用 #define 的宏来简化你的写法和记忆了 :)

再举一个例子:

#include "move_emu.hpp"
#include <iostream> class integer
{
COPYABLE_AND_MOVABLE(integer)
public:
int * value;

// default constructor
integer() : value(new int()) {
std::cout << "default construct!" << std::endl;
}

// constructor(int)
integer(int __val) : value(new int(__val)) {
std::cout << "num construct!" << std::endl;
}

// copy constructor
integer(const integer & x) : value(new int(*(x.value))) {
std::cout << "Copy construct!" << std::endl;
}

// move constructor
integer(RV_REF(integer) x) :
value(x.value)
{
std::cout << "Move construct!" << std::endl; x.value = NULL;
}

// destructor
~integer() {
std::cout << "Destructor!" << std::endl;
delete value;
} /**
* Copy assignment -- replace const integer & x
* with const rv<integer> & x
* reason -- let factory(rhs) function use operator=(integer & x)
*/
// copy assignment
integer & operator =(COPY_ASSIGN_REF(integer) x) {
std::cout << "Copy assign!" << std::endl; if(this != &x) {
delete value;
value = new int(*(x.value));
}
return *this;
}

// move assignment
integer & operator =(RV_REF(integer) x) {
std::cout << "Move assign!" << std::endl; if (this != &x) {
delete value;
value = x.value;
x.value = NULL;
}
return *this;
}
}; integer factory(int i) {
integer ret;
*(ret.value) = (i + );
return ret;
} int main()
{
integer x1();
std::cout << "x1 = " << *x1.value << std::endl;
std::cout << "-----------------" << std::endl; integer x2 = move_emu(x1);
std::cout << std::boolalpha << "x1.value == NULL: "
<< (x1.value == NULL) << std::endl;
std::cout << "x2 = " << *x2.value << std::endl;
std::cout << "-----------------" << std::endl; integer x3(move_emu(move_emu(x2)));
std::cout << std::boolalpha << "x2.value == NULL: "
<< (x2.value == NULL) << std::endl;
std::cout << "x3 = " << *x3.value << std::endl;
std::cout << "-----------------" << std::endl; // do not use move_emu(factory(1024)), failure.
// std::move(factory(1024)) success.
integer x4;
x4 = factory();
std::cout << "x4 = " << *x4.value << std::endl;
std::cout << "-----------------" << std::endl; const integer x5();
std::cout << "x5 = " << *x5.value << std::endl;
std::cout << "-----------------" << std::endl; // std::move will convert it into a copy construction
const integer x6 = move_emu(x5);
std::cout << std::boolalpha << "x5.value == NULL: "
<< (x5.value == NULL) << std::endl;
std::cout << "x6 = " << *x6.value << std::endl;
std::cout << "-----------------" << std::endl; return ;
}

参考:

Boost.Move

05-11 17:27