计算平方根的速度有多慢(多少个周期)?这是在分子动力学类(class)中提出的,在该类(class)中,效率很重要,而不必要的平方根对算法的运行时间有明显的影响。

最佳答案

从Agner Fog的说明表中:

在Core2 65nm上,取决于值和精度位,FSQRT占用9到69 cc(互惠吞吐量几乎相等)。为了进行比较,FDIV占用了9到38 cc的电流(互惠吞吐量几乎相等),FMUL占用了5 cc(接收吞吐量= 2),FADD占用了3 cc(接收吞吐量= 1)。 SSE性能大致相同,但是看起来更快,因为它不能执行80位数学运算。 SSE具有超快速的近似倒数和近似倒数sqrt。

在Core2 45nm上,除法和平方根更快。 FSQRT占6至20 cc,FDIV占6至21 cc,FADD和FMUL不变。 SSE的性能再一次差不多。

您可以从his website获得带有此信息的文档。

关于performance - 计算平方根的速度有多慢(多少个周期)?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/7724061/

10-15 12:34