有谁知道 Fermi 中 L2 缓存的相关信息?我听说它和全局内存一样慢,使用L2只是为了扩大内存带宽。但我找不到任何官方消息来源来证实这一点。有没有人测量过 L2 的命中延迟?尺寸、线尺寸和其他参数呢?

实际上,L2 读取未命中如何影响性能?在我看来,L2 只在内存受限的应用程序中有意义。
请随时发表您的意见。

谢谢

最佳答案

这个 thread in the nvidia 有一些性能特性的测量。虽然它不是官方信息,也可能不是 100% 准确,但它至少为行为提供了一些指示,所以我认为它在这里可能有用(以时钟周期测量):

同一线程中的另一篇文章给出了这些结果:

关于cuda - Fermi L2 缓存命中延迟?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/6744101/

10-12 23:36