所以我有一些代码
#define umul_ppmm(w1, w0, u, v) \
asm ("mulq %3" \
: "=a" (w0), "=d" (w1) \
: "0" ((uint64_t)(u)), "rm" ((uint64_t)(v)))
我正在尝试调试它,并了解它是如何工作的。
目前,我正在查看This pdf以供
mulq
参考。到目前为止,我的理解是它将两个64位数字相乘,分别是
w0
和u
。然后,将乘法结果存储在w0
和w1
中。我的主要问题是:
根据This GCC assembly guide on Simple Constraints,
"=a"
和"=d"
中的'a'和'd'分别是地址和数据寄存器。在这里如何发挥作用,这到底意味着什么?在这种情况下
"0"
是什么意思?该指南还指出“允许与指定操作数编号匹配的操作数”。这里匹配的操作数是什么?v
如何发挥作用?如果有的话在函数调用之前和之后打印出变量
w1 w0 u v
2097147 549755813889 17179869183 4611684961865433149
4294966311 17179869183 13835060159816138691 4611684961865433149
最佳答案
mulq
指令在a
和d
寄存器(通常称为rax
和rdx
)中隐式产生结果。
操作数从零开始索引。因此,"0"
与第一个操作数w0
的位置相同。 mulq
隐式使用rax
作为输入操作数之一,因此匹配约束。可以再次将其写为"a"
。v
是操作数%3
,它是mulq
指令中引用的唯一显式操作数。该代码将u
和v
相乘,因此当然可以“发挥作用”。
您错误地打印了寄存器,在第二行交换了w0
和u
,因为u
和v
是不变的输入操作数。u*v=w1*2^64+w0
,即17179869183*4611684961865433149=4294966311*2^64+13835060159816138691