我需要每秒运行240000次矩阵 vector 乘法。矩阵为5x5,并且始终相同,而 vector 在每次迭代时都会变化。数据类型为float。我当时正在考虑使用一些SSE(或类似的)指令。

  • 我担心算术运算的数量与所涉及的内存运算的数量相比太少。您认为我可以获得一些明显的改善(例如> 20%)吗?
  • 我需要英特尔编译器吗?
  • 您能指出一些引用资料吗?
  • 最佳答案

    用于 vector ,矩阵等的Eigen C++模板库

  • 针对小型固定大小矩阵(以及动态大小的矩阵)的优化代码
  • 使用SSE优化的优化代码

  • 所以您应该尝试一下。

    关于c++ - 使用SSE加速float 5x5矩阵* vector 乘法,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/6617688/

    10-09 15:36
    查看更多