mt19937_64
是否具有比 32 位版本 mt19937
更高的吞吐量(bit/s),假设是 64 位架构?
矢量化之后呢?
最佳答案
正如@byjoe 指出的那样,这显然取决于编译器。
在这种情况下,它似乎比典型情况更依赖于编译器。例如,评论中链接的 Boost 测试使用了 VC++ 2010 的编译器,并且与使用 mt19937_64 相比,每秒随机位仅略有增加。
为了获得更多最新信息,我进行了一个简单的测试:
#include <random>
#include <chrono>
#include <iostream>
#include <iomanip>
template <class T, class U>
U test(char const *label, U count) {
using namespace std::chrono;
T gen(100);
U result = 0;
auto start = high_resolution_clock::now();
for (U i = 0; i < count; i++)
result ^= gen();
auto stop = high_resolution_clock::now();
std::cout << "Time for " << std::left << std::setw(12) << label
<< duration_cast<milliseconds>(stop - start).count() << "\n";
return result;
}
int main(int argc, char **argv) {
unsigned long long limit = 1000000000;
auto result1 = test<std::mt19937>("mt19937: ", limit);
auto result2 = test<std::mt19937_64>("mt19937_64: ", limit);
std::cout << "Ignore: " << result1 << ", " << result2 << "\n";
}
使用 VC++ 2015 udpate 3(使用/o2b2/GL,虽然可能无关紧要),我得到了如下结果:
Time for mt19937: 4339
Time for mt19937_64: 4215
Ignore: 2598366015, 13977046647333287932
这表明 mt19937_64 每次调用的速度略快,因此每比特的速度是 mt19937 的两倍多。使用 MinGW(使用 -O3),结果更像是从 Boost 站点链接的结果:
Time for mt19937: 2211
Time for mt19937_64: 4183
Ignore: 2598366015, 13977046647333287932
在这种情况下,mt19937_64 每次调用所需的时间不到两倍,因此每比特只稍微快一点。最高的整体速度似乎来自带有 mt19937_64 的 g++,但 g++ 和 VC++(在这些运行中)之间的差异小于 1%,所以我不确定它是否可重现。
就其值(value)而言,使用 VC++ 的 mt19937 和 mt19937_64 之间的速度差异(每次调用)也非常小,但似乎是可重现的——它在我的测试中一直发生。我确实想知道这是否可能(至少部分)是时钟管理的问题——当代码第一次启动时,CPU 空闲,时钟变慢,所以第一次运行的第一部分是在较低的时钟速度。为了检查,我颠倒了顺序来首先测试 mt19937_64。我认为我的假设至少部分正确——当我颠倒顺序时,mt19937_64 与 mt19937 相比变慢了,所以它们在每次调用的基础上与 VC++ 几乎相同。
关于c++ - std::mt19937_64 比 std::mt19937 快吗?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/39154516/