我使用Criterion库为Haskell函数编写了基准。现在,我正在用C实现相同的算法,以将性能与Haskell进行比较。问题是我怎样才能可靠地做到这一点? Criterion做很多花哨的事情,例如考虑时钟调用开销和对结果进行统计分析。我猜想,如果仅测量C函数所需的时间,它将无法与Criterion返回的结果相提并论。 Bryan O'Sullivan在他的original post about Criterion中写道:“使用准则对C代码和命令行程序进行基准测试甚至应该更加容易。”问题是如何? Takayuki Muranushi compares C implementation of DFT与Haskell一起产生了线程并调用了可执行文件,但我担心这会增加很多额外的开销(创建新线程,运行应用程序,输出到stdio,然后从中读取),从而导致结果无与伦比。我也考虑过使用FFI,但是我再次担心,额外的开销会使这种比较不公平。

如果无法使用Criterion可靠地对C进行基准测试,那么您会推荐哪种方法进行C基准测试?我在这里已经阅读了一些关于SO的问题,似乎有许多不同的功能可以用来度量系统时间,但是它们要么以毫秒为单位提供时间,要么具有较大的通话开销。

最佳答案

FFI的使用方式不会增加太多开销。考虑以下程序(完整代码可通过here获得):

foreign import ccall unsafe "mean" c_mean :: Ptr CInt -> CUInt -> IO CFloat

main :: IO ()
main = do
  buf <- mallocBytes (bufSize * sizeOfCInt)
  fillBuffer buf 0
  m <- c_mean buf (fromIntegral bufSize)
  print $ realToFrac m

C调用被编译为以下Cmm:
s2ni_ret() { ... }
    c2qy:
        Hp = Hp + 12;
        if (Hp > I32[BaseReg + 92]) goto c2qC;
        _c2qD::I32 = I32[Sp + 4];
        (_s2m3::F32,) = foreign "ccall"
          mean((_c2qD::I32, PtrHint), (100,));

这是程序集:
s2ni_info:
.Lc2qy:
        addl $12,%edi
        cmpl 92(%ebx),%edi
        ja .Lc2qC
        movl 4(%ebp),%eax
        subl $4,%esp
        pushl $100
        pushl %eax
        ffree %st(0) ;ffree %st(1) ;ffree %st(2) ;ffree %st(3)
        ffree %st(4) ;ffree %st(5)
        call mean

因此,如果将C导入标记为unsafe并在测量之前进行所有编组,则C调用基本上只是一个内联call指令-就像您在C中进行所有基准测试一样。这是我对C进行基准测试时Criterion报告的内容什么都不做的功能:
benchmarking c_nothing
mean: 13.99036 ns, lb 13.65144 ns, ub 14.62640 ns, ci 0.950
std dev: 2.306218 ns, lb 1.406215 ns, ub 3.541156 ns, ci 0.950
found 10 outliers among 100 samples (10.0%)
  9 (9.0%) high severe
variance introduced by outliers: 91.513%
variance is severely inflated by outliers

这大约比我的机器上估计的时钟分辨率(约5.5 us)小400倍。为了进行比较,下面是计算100个整数的算术平均值的函数的基准数据:
benchmarking c_mean
mean: 184.1270 ns, lb 183.5749 ns, ub 185.0947 ns, ci 0.950
std dev: 3.651747 ns, lb 2.430552 ns, ub 5.885120 ns, ci 0.950
found 6 outliers among 100 samples (6.0%)
  5 (5.0%) high severe
variance introduced by outliers: 12.329%
variance is moderately inflated by outliers

10-08 20:02