在使用冒泡排序算法对数组进行排序的场景中,该算法更有效地在嵌套循环内创建临时变量或使用xor运算符:

#include <iostream>

int main()
{
    int array[5] = {7, 2, 5, 3, 4};

    /*1: using temporary variable

    for(int i(0); i < 5; i++)
    {
        for(int j(i + 1); j < 5; j++)
        {
            if(array[i] > array[j])
            {
                int tmp  = array[i];
                array[i] = array[j];
                array[j] = tmp;
            }
        }
    }
    */

    //2: using xor ^ swapper
    for(int i = 0; i < 5; i++)
    {
        for(int j(i + 1); j < 5; j++)
        {
            if(array[i] > array[j])
            {
                array[i] ^= array[j];
                array[j] ^= array[i];
                array[i] ^= array[j];
            }
        }
    }


    for( i = 0; i < 5; i++)
        std::cout << array[i] << ", ";

    std::cout << std::endl;
    return 0;
}

我只想知道这两种方法都能正常工作,所以哪个更快更强大。

最佳答案

正如其他人已经指出的那样,要确定知道的唯一方法就是测量它。

“如何衡量?”如果这样的问题是关于stackoverflow的话题,那将是一个完全不同的问题。但事实并非如此。

Google是您的 friend 。谷歌一下。查找诸如“基准”或“配置文件”之类的关键字以及“C++”以及您正在使用的IDE的名称。

除此之外,我还可以通过阅读说明为您提供一个很好的指示,说明哪个会更快。

指令顺序

  a ^= b;
  b ^= a;
  a ^= b;

转换为以下未优化的说明:
  load  register from a            ;memory reference
  xor   register with b            ;memory reference
  store register to a              ;memory reference
  load  register from b            ;memory reference
  xor   register with a            ;memory reference
  store register to b              ;memory reference
  load  register from a            ;memory reference
  xor   register with b            ;memory reference
  store register to a              ;memory reference

可能会优化如下:
  load  register1 from a           ;memory reference
  load  register2 from b           ;memory reference
  xor register1 with register2
  xor register2 with register1
  xor register1 with register2
  store register1 to a             ;memory reference
  store register2 to b             ;memory reference

指令顺序
  int tmp  = a;
  a = b;
  b = tmp;

转换为以下未优化的说明:
  load  register from a            ;memory reference
  store register to tmp            ;memory reference
  load  register from b            ;memory reference
  store register to a              ;memory reference
  load  register from tmp          ;memory reference
  store register to b              ;memory reference

可能会优化如下:
  load register1 from a            ;memory reference
  load register2 from b            ;memory reference
  store register1 to b             ;memory reference
  store register2 to a             ;memory reference

如您所见,这两个优化的片段仅包含四个内存引用,因此这两种方法大致相等,但是XOR方法包含3条额外的指令,因此它可能无法获得更好的性能。

不相信我吗好吧,不要相信我!我什至不能确定您的编译器可以执行哪些其他类型的优化。因此,除了运行基准测试或分析代码外,还请尝试查看编译器为上述代码片段生成的程序集。 (当然,启用所有优化。)

10-04 13:08
查看更多