我正在构建一个工作站,并希望参与一些繁重的CUDA编程。我不想全力以赴地购买Tesla卡,并将其范围缩小到Quadro 4000和GeForce 480,但是我真的不明白区别,在纸面上看起来480具有更多核心480与480的480对比256,但4000的价格几乎是480的两倍。有人了解这里的区别以证明更高的价格合理吗?

我将在其上进行科学计算,因此如果两者之间有所不同,那么所有内容都将具有 double 。

最佳答案

如果您既不关心可视化也不关心渲染(在屏幕上绘制最终结果,例如光线追踪),那么问题的答案会稍微简单一些,但并不简单。

我不会详细介绍Quadro和GeForce卡之间的区别,但我只是强调可以在选择它们之间的重要点。

一般来说:

  • 如果您需要大量内存,而不是Tesla或Quadro。消费卡ATM的最大容量为1.5 Gb(GTX 480),而Teslas和Quadros的最大容量为6 Gb。
  • GF10x系列卡的 double (FP64)性能上限为单精度(FP32)性能的1/8,而该体系结构的能力为1/2。如今,在硬件制造商中颇为流行的另一个市场细分技巧。削弱GeForce产品线旨在使Tesla线在HPC中具有优势。实际上,GTX 480比Tesla 20x0-1.34TFlops和1.03 TFlops,177.4 Gb vs 144 Gb / sec(峰值)快。
  • Tesla和Quadro(应该经过)经过了更全面的测试,因此不太容易产生与游戏无关的错误,但是在科学计算方面,仅一点点翻转就可以浪费结果。 NVIDIA声称Tesla卡是QC-d,可24/7使用。

    最近的一篇论文(Haque and Pande, Hard Data on Soft Errors: A Large-Scale Assessment of Real-World Error Rates in GPGPU)暗示,特斯拉确实不那么容易出错。
  • 我的经验是GeForce卡的可靠性往往较差,特别是在持续高负载的情况下。正确的散热非常重要,并且要避免超频的显卡(包括出厂时过时的机型)(请参见previously mentioned paper的图1)。

  • 因此,根据经验:
  • 用于开发:GeForce(除非您绝对需要> 1.5 Gb内存)
  • 用于生产HPC /科学计算:
  • Tesla:如果您需要大量内存或FP64(+可靠性?)
  • Quadro如果需要FP64和/或还需要高级渲染功能(新的“Fermi”特斯拉具有与GeForce类似的渲染功能)

    如果您想密集使用FP64,请不要使用GeForce,否则请忽略
  • **非工厂超频* GeForce *:省钱;)

  • 返回您问题的具体内容:

    您提到的两张牌来自完全不同的联赛,因此不能直接比较。如果需要Quadro的渲染功能,请使用Quadro。否则,Quadro并不真正值得,尤其是4000,它甚至比GTX 460还要慢,而价格却高出约3.5倍。我认为您最好使用GTX 470或480,只需确保购买标准频率的产品即可。

    请注意,在这次比较中,受损的GeForce double 性能不是问题,但让我详细说明一下。由于Quadro 4000是一款带有AFAIR的低端机型,只有450 MHz着色器(我找不到引用ATM,但它绝对应该低于主频为513 MHz的5000),这使其具有115 GFlops FP64。同时,封顶的GTX 480约为168 GFlops FP64,甚至GTX 460约为113 GFlops(峰值)。
    在与GTX 480配套的Quadro 4000上,FP32的性能和内存带宽要低得多(86.9 vs 177.4 GB / s)!

    请注意,从理论峰值性能的 Angular 来看,GTX 480(data sheet)比Tesla C2050/2070Quadro 6000都快得多,这在大多数应用中都得到了体现。

    关于hardware - 与CUDA硬件Quadro 4000 Vs的区别。 GeForce 480,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/3721504/

    10-13 06:05