我不是在谈论算法问题(例如,使用quicksort而不是Bubblesort),也不是在谈论诸如循环展开之类的简单事情。

我说的是硬核东西。像Tiny Teensy ELFThe Story of Mel;几乎所有的内容都在模拟场景中,依此类推。

最佳答案

我曾经写过一次蛮力的RC5键搜索,一次可以处理两个键,第一个键使用整数流水线,第二个键使用SSE流水线,而两个键在指令级别交错。然后,这与主管程序结合在一起,该主管程序在系统的每个内核上运行代码实例。总体而言,该代码的运行速度比朴素的C版本快25倍。

09-08 11:25