我正在用C#构建一个小型编译器,因此不可避免地不得不混入动态程序集并发出操作码。现在,奇怪的是,我的Emit()调用在生成的模块中创建了其他nop操作码。在我看来,这并不是很重要,因为性能并不是很关键,但是老实说,这使我感到困惑。它似乎是在加载或存储到本地或参数之后发生的。是否有任何C#/动态汇编专家指出我可以检查的内容?我已经附上了所生成代码的样本,如果需要更多信息,请告诉我。谢谢。
IL_0000: ldc.i4 0x0
IL_0005: stloc c
IL_0009: nop
IL_000a: nop
IL_000b: ldloc c
IL_000f: nop
IL_0010: nop
IL_0011: stloc i
IL_0015: nop
IL_0016: nop
IL_0017: ldarg s
IL_001b: nop
IL_001c: nop
IL_001d: ldloc i
IL_0021: nop
IL_0022: nop
IL_0023: add
IL_0024: stloc $0
IL_0028: nop
IL_0029: nop
IL_002a: ldloc $0
IL_002e: nop
IL_002f: nop
IL_0030: ldind.i1
IL_0031: ldc.i4 0x0
IL_0036: bne.un IL_0040
IL_003b: br IL_008e
IL_0040: ldloc c
IL_0044: nop
IL_0045: nop
IL_0046: stloc $1
根据要求,这里概述了我的代码的外观。缺少一些东西,因为代码被分为不同的部分
模块,它们是它们执行顺序中最相关的部分。
string programName = "myprogram";
AssemblyBuilder assemblyBuilder = Thread.GetDomain().DefineDynamicAssembly(new AssemblyName(programName), AssemblyBuilderAccess.RunAndSave);
ModuleBuilder module = n.AssemblyBuilder.DefineDynamicModule(programName, string.Format("{0}.exe", programName), true);
string contextName = string.Format("{0}.{1}", programName, "context");
MethodAttributes attributes = MethodAttributes.Private | MethodAttributes.Static;
MethodBuilder methodBuilder = typeBuilder.DefineMethod(method, attributes, returnType, paramTypes);
foreach (string name in paramNames)
methodBuilder.DefineParameter(i++, ParameterAttributes.None, name);
ILGenerator Cil = methodBuilder.GetILGenerator();
...
foreach (var g in qLocals)
{
LocalBuilder localBuilder = Cil.DeclareLocal(type);
localBuilder.SetLocalSymInfo(g.Name);
}
foreach (var s in strings)
{
LocalBuilder localBuilder = Cil.DeclareLocal(typeIndexed.DotNetElementType. MakePointerType());
localBuilder.SetLocalSymInfo(string.Format("_{0}", index));
}
IEnumerable<Quad> jumpTargets =
(from q in n.Tac
select q.Addrs.OfType<AddrQuad>()).
SelectMany(x => x).Select(a => a.Quad).Distinct();
foreach (Quad q in jumpTargets)
q.DefineLabel(Cil);
}
对于我的抽象语法树(用三个地址代码装饰)上的每个节点,我只需执行以下操作:
public override void DefaultPost(NodeBase n)
{
foreach (Quad q in n.Tac)
q.Emit(Cil);
}
这是此函数产生的一系列调用:
cil.Emit(OpCodes.Ldloc, Index);
cil.Emit(OpCodes.Stloc, Index);
cil.Emit(OpCodes.Ldc_I4, (int)this.i);
cil.Emit(OpCodes.Stloc, Index);
cil.Emit(OpCodes.Ldloc, Index);
cil.Emit(OpCodes.Ldc_I4, (int)this.i);
cil.Emit(OpCodes.Br, res.Quad.Label.Value);
cil.Emit(OpCodes.Ldloc, Index);
cil.Emit(OpCodes.Ldc_I4, (int)this.i);
cil.Emit(OpCodes.Stloc, Index);
cil.Emit(OpCodes.Ldloc, Index);
cil.Emit(OpCodes.Stloc, Index);
cil.Emit(OpCodes.Ldloc, Index);
cil.Emit(OpCodes.Ldc_I4, (int)this.i);
cil.Emit(OpCodes.Bge, quad.Label.Value);
cil.Emit(OpCodes.Br, res.Quad.Label.Value);
...
我不知道这是否有帮助,如果您想查看我的完整项目,请访问:
http://github.com/yannikab/grc
与目标代码生成相关的所有内容都在Cil命名空间下。将所有内容组合在一起以生成代码的类称为CilVisitor。
最佳答案
如注释中所述,对于Ldarg
,Stloc
和Ldloc
操作码,您应该使用Emit
重载,该重载接受short
作为第二个参数,而Index
大概是int
,因此使用了错误的Emit
重载。 IL生成器不会对此进行检查,仅将值的所有4个字节输出到IL流。 2个高位字节为零,在IL中为nop
,因此在反汇编中为nop
。
将Index
的类型更改为short
,或在传递给Emit
时将其强制转换。
关于.net - 为什么ILGenerator.Emit()在动态汇编中插入nop操作码?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/44664469/