对于线程安全的惰性初始化,应该在函数std::call_once还是显式的双重检查锁定中首选静态变量?有什么有意义的区别吗?
这三个问题都可以看到。
Double-Checked Lock Singleton in C++11
在Google中出现了两种版本的C++ 11中的双重检查锁定。
Anthony Williams shows都使用显式的内存顺序和std::call_once仔细检查了锁定。他没有提到static,但是该文章可能是在C++ 11编译器可用之前写的。
Jeff Preshing在广泛的writeup中描述了双重检查锁定的几种变体。他的确提到使用静态变量作为选项,甚至展示了编译器将生成用于双重检查锁定的代码以初始化静态变量。我不清楚他是否得出结论,一种方法比另一种方法更好。
我认为这两篇文章都具有教学意义,没有理由这样做。如果您使用静态变量或std::call_once,则编译器将为您完成此操作。
最佳答案
GCC利用特定于平台的技巧来完全避免在快速路径上进行原子操作,这是因为GCC可以比call_once或仔细检查更好地进行static
分析。
因为仔细检查使用原子作为避免种族冲突的方法,所以它必须每次付出收购的代价。这不是一个很高的价格,但它是一个价格。
它必须付出代价,因为原子在所有情况下都必须保持原子状态,即使是比较交换之类的困难操作也是如此。这使得优化起来非常困难。一般来说,编译器必须将其保留,以防万一您将变量用作多个双锁。没有简单的方法可以证明您从未在原子上使用过更复杂的操作之一。
另一方面,static
是高度特化的语言,并且是语言的一部分。从一开始,它的设计就非常容易证明可初始化。因此,编译器可以采用更通用版本不可用的快捷方式。 The compiler actually emits下面的代码为静态的:
一个简单的功能:
void foo() {
static X x;
}
在GCC中被重写为:
void foo() {
static X x;
static guard x_is_initialized;
if ( __cxa_guard_acquire(x_is_initialized) ) {
X::X();
x_is_initialized = true;
__cxa_guard_release(x_is_initialized);
}
}
看起来很像是双重检查的锁。但是,编译器会在此处作弊。它知道用户永远不能直接使用
cxa_guard
编写。它知道仅在编译器选择使用它的特殊情况下使用它。因此,有了这些额外的信息,它可以节省一些时间。 CXA保护程序规范(按其分布情况)均共享一个common rule:__cxa_guard_acquire
绝不会修改保护程序的第一个字节,而__cxa_guard__release
会将其设置为非零。这意味着每个 guard 必须是单调的,并确切说明将要执行的操作。因此,它可以利用主机平台中现有的竞争案例保护。例如,在x86上,由高度同步的CPU保证的LL/SS保护足以执行此获取/ Release模式,因此当它进行双重锁定时,它可以对第一个字节进行原始读取,而不是阅读阅读。这仅是可能的,因为GCC并未使用C++原子API进行双重锁定-而是使用了platform specific approach。
在一般情况下,GCC无法优化原子。在设计为不那么同步的架构上(例如为1024+内核设计的架构),GCC不必依靠该架构来为其进行LL/SS。因此,GCC被迫实际发射原子。但是,在x86和x64等常见平台上,它可能会更快。
call_once
具有GCC静态功能的效率,因为它类似地将可以对once_flag
执行的操作数限制为可以应用于原子函数的一部分。权衡是,在适用静态变量时,使用静态函数要方便得多,但是call_once
在静态变量不足的许多情况下都可以工作(例如,动态生成的对象拥有的once_flag
)。在这些高级平台上,static和
call_once
之间的性能略有不同。其中许多平台虽然不提供LL/SS,但至少会提供不破坏整数的读取。这些平台可以使用它和线程专用指针来执行per-thread epoch counting to avoid atomics。这对于static或call_once
足够了,但取决于计数器是否不会翻转。如果您没有不易撕裂的64位整数,则call_once
必须担心翻转。实现可能对此担心,也可能不担心。如果忽略此问题,则其速度可以与静态速度一样快。如果它关注这个问题,它的运行速度必须与原子一样慢。静态在编译时就知道有多少个静态变量/块,因此可以证明在编译时没有翻转(或者至少要放心!)关于c++ - 线程安全的惰性初始化:静态vs std::call_once vs双重检查锁定,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/26013650/