您是否知道哪个GCC优化标志最适合构建应用程序,它使用双浮点并实时进行大量计算,并且使用-lm。目标硬件是板载Linux的两个Dual-Xeon。提前致谢!

最佳答案

“ Dual-Xeon”不是您要定位的处理器的精确规格-“ Xeon”更多是营销品牌名称,而不是特定型号。 “ Xeon”甚至不会告诉您目标是IA32还是x86-64体系结构。

这很重要,因为可以通过针对特定的CPU系列显着改善优化。 described in the GCC documentation有很多选项;特别是,从-march开始为特定的指令集生成代码。

如果不针对x86-64,则使用-mfpmath=sse(如果CPU类型支持)对浮点使用SSE指令,而不是387(x86-64上的默认选项)。同样,-malign-double可以加快速度(但仅在x86-64上是默认设置)。

同样,如果在配置文件时在libmath中使用的功能显示为热点,则使用更具体的优化标志重新编译该库可能会有所帮助。

09-04 05:17