mt19937_64 是否具有比 32 位版本 mt19937 更高的吞吐量(bit/s),假设是 64 位架构?

矢量化之后呢?

最佳答案

正如@byjoe 指出的那样,这显然取决于编译器。

在这种情况下,它似乎比典型情况更依赖于编译器。例如,评论中链接的 Boost 测试使用了 VC++ 2010 的编译器,并且与使用 mt19937_64 相比,每秒随机位仅略有增加。

为了获得更多最新信息,我进行了一个简单的测试:

#include <random>
#include <chrono>
#include <iostream>
#include <iomanip>

template <class T, class U>
U test(char const *label, U count) {
    using namespace std::chrono;
    T gen(100);

    U result = 0;

    auto start = high_resolution_clock::now();
    for (U i = 0; i < count; i++)
        result ^= gen();
    auto stop = high_resolution_clock::now();
    std::cout << "Time for " << std::left << std::setw(12) << label
        << duration_cast<milliseconds>(stop - start).count() << "\n";
    return result;
}

int main(int argc, char **argv) {
    unsigned long long limit = 1000000000;

    auto result1 = test<std::mt19937>("mt19937: ", limit);
    auto result2 = test<std::mt19937_64>("mt19937_64: ", limit);

    std::cout << "Ignore: " << result1 << ", " << result2 << "\n";
}

使用 VC++ 2015 udpate 3(使用/o2b2/GL,虽然可能无关紧要),我得到了如下结果:
Time for mt19937:    4339
Time for mt19937_64: 4215
Ignore: 2598366015, 13977046647333287932

这表明 mt19937_64 每次调用的速度略快,因此每比特的速度是 mt19937 的两倍多。使用 MinGW(使用 -O3),结果更像是从 Boost 站点链接的结果:
Time for mt19937:    2211
Time for mt19937_64: 4183
Ignore: 2598366015, 13977046647333287932

在这种情况下,mt19937_64 每次调用所需的时间不到两倍,因此每比特只稍微快一点。最高的整体速度似乎来自带有 mt19937_64 的 g++,但 g++ 和 VC++(在这些运行中)之间的差异小于 1%,所以我不确定它是否可重现。

就其值(value)而言,使用 VC++ 的 mt19937 和 mt19937_64 之间的速度差异(每次调用)也非常小,但似乎是可重现的——它在我的测试中一直发生。我确实想知道这是否可能(至少部分)是时钟管理的问题——当代码第一次启动时,CPU 空闲,时钟变慢,所以第一次运行的第一部分是在较低的时钟速度。为了检查,我颠倒了顺序来首先测试 mt19937_64。我认为我的假设至少部分正确——当我颠倒顺序时,mt19937_64 与 mt19937 相比变慢了,所以它们在每次调用的基础上与 VC++ 几乎相同。

关于c++ - std::mt19937_64 比 std::mt19937 快吗?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/39154516/

10-11 17:20
查看更多