我正在努力提高对C++实际工作方式的理解。有没有办法看到编译器如何将我的代码简化为更简单的代码?例如,我想看看如何调用所有拷贝构造函数,如何解决重载函数调用,如何完成所有模板扩展和实例化等。现在,我正在学习C++编译器如何通过实验解释我的代码的方法。 ,但即使代码看起来很丑陋,也很高兴能看到我的代码的简化形式。我正在寻找类似于g++ -E的东西,该东西显示了预处理器的结果,但适用于C++。

编辑:我应该补充一点,我不是在寻找反汇编程序。 C++源代码和汇编代码之间存在巨大鸿沟。在这个鸿沟之内是复杂的事情,例如模板元编程和对运算符方法的各种隐式调用(赋值!强制转换!构造函数!...),以及具有非常复杂的解析规则的重载函数等。我正在寻找帮助我了解C++编译器如何解释我的代码的工具。现在,我唯一能做的就是尝试一些小实验,并逐步了解编译器在做什么。我想了解发生的事情的更多细节。例如,这对于调试模板元编程问题将有很大帮助。

最佳答案

目前,我认为您最好的选择是Clang(您可以在Try Out LLVM页面上尝试一些简单的代码)。

使用Clang/LLVM编译C,C++或Obj-C时,您可能会要求编译器发出中间表示(LLVM IR),而不是完全采用汇编/二进制形式。

LLVM IR是编译器内部使用的完整指定语言:

  • CLang将C++代码降低为LLVM IR
  • LLVM优化IR
  • LLVM后端(例如x86)从IR
  • 生成程序集

    IR是机器特定代码之前的最后一步,因此您不必学习特定的汇编指令,并且仍然可以很底层地了解引擎盖下的实际情况。

    您可以在优化前后获得IR,后者可以更真实地代表实际代码,但与原始编写的内容相距甚远。

    C程序示例:
    #include <stdio.h>
    #include <stdlib.h>
    
    static int factorial(int X) {
      if (X == 0) return 1;
      return X*factorial(X-1);
    }
    
    int main(int argc, char **argv) {
      printf("%d\n", factorial(atoi(argv[1])));
    }
    

    对应的IR:
    ; ModuleID = '/tmp/webcompile/_10956_0.bc'
    target datalayout = "e-p:64:64:64-i1:8:8-i8:8:8-i16:16:16-i32:32:32-i64:64:64-f32:32:32-f64:64:64-v64:64:64-v128:128:128-a0:0:64-s0:64:64-f80:128:128-n8:16:32:64"
    target triple = "x86_64-unknown-linux-gnu"
    
    @.str = private unnamed_addr constant [4 x i8] c"%d\0A\00"
    
    define i32 @main(i32 %argc, i8** nocapture %argv) nounwind {
    ; <label>:0
      %1 = getelementptr inbounds i8** %argv, i64 1
      %2 = load i8** %1, align 8, !tbaa !0
      %3 = tail call i64 @strtol(i8* nocapture %2, i8** null, i32 10) nounwind
      %4 = trunc i64 %3 to i32
      %5 = icmp eq i32 %4, 0
      br i1 %5, label %factorial.exit, label %tailrecurse.i
    
    tailrecurse.i:                                    ; preds = %tailrecurse.i, %0
      %indvar.i = phi i32 [ %indvar.next.i, %tailrecurse.i ], [ 0, %0 ]
      %accumulator.tr1.i = phi i32 [ %6, %tailrecurse.i ], [ 1, %0 ]
      %X.tr2.i = sub i32 %4, %indvar.i
      %6 = mul nsw i32 %X.tr2.i, %accumulator.tr1.i
      %indvar.next.i = add i32 %indvar.i, 1
      %exitcond = icmp eq i32 %indvar.next.i, %4
      br i1 %exitcond, label %factorial.exit, label %tailrecurse.i
    
    factorial.exit:                                   ; preds = %tailrecurse.i, %0
      %accumulator.tr.lcssa.i = phi i32 [ 1, %0 ], [ %6, %tailrecurse.i ]
      %7 = tail call i32 (i8*, ...)* @printf(i8* getelementptr inbounds ([4 x i8]* @.str, i64 0, i64 0), i32 %accumulator.tr.lcssa.i) nounwind
      ret i32 0
    }
    
    declare i32 @printf(i8* nocapture, ...) nounwind
    
    declare i64 @strtol(i8*, i8** nocapture, i32) nounwind
    
    !0 = metadata !{metadata !"any pointer", metadata !1}
    !1 = metadata !{metadata !"omnipotent char", metadata !2}
    !2 = metadata !{metadata !"Simple C/C++ TBAA", null}
    

    我个人发现它相对可读(它试图保留变量名,某种程度上,函数名仍然存在),一旦您摆脱了对语言的最初发现。

    关于c++ - 如何查看降低的C++,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/7207397/

    10-13 08:18