当我将指向数组的指针从Rust传递到x86-64 Asm时,相关的寄存器(rdi,rsi)似乎偏移了一个,指向数组的元素1而不是元素0。我可以递减寄存器以访问所需的寄存器位置,但我担心意外行为。我可能对此有可能的解释吗?

下面是一个简单的程序中最相关的部分来说明这一点。

main.rs

extern crate utilities;

fn main() {
    let input: [u8;8] = [0;8];
    let output: [u64; 1] = [0;1];

    let input_ptr = input.as_ptr();
    let output_ptr = output.as_ptr();

    utilities::u8tou64(input_ptr,output_ptr);

    for i in 0..8 {print!("{:02X}", input[i]);} // byte 1 will be 0xEE
    println!();
    println!("{:016X}", output[0].swap_bytes());  /* byte 1 position of the u64
    will be 0xFF */

    println!("{:02X}",  unsafe{*input_ptr.offset(1)}); /* modifying byte at address
    passed into rdi in Asm function modifies input_ptr.offset(1) when expected
    behavior was modification of input_ptr with no offset, e.g. input[0] */
}

u8_to_u64.S
.globl u8_to_u64
.intel_syntax noprefix
u8_to_u64:
    mov rax, 0xff
    mov byte [rsi], rax
    mov rax, 0xee
    mov byte [rdi], rax
    xor rax, rax
retq

最佳答案

我用gcc -c foo.S组装了asm,因为我以为我会从byte而不是byte ptr收到组装时错误,并且与qword寄存器不匹配。

在GAS语法中, byte的计算结果为整数常量1 ,因此mov byte [rsi], rax等效于mov 1[rsi], rax。这在GAS语法中有效,等效于[1+rsi]
当您使用foo.o分解objdump -dwrC -Mintel时,您会看到

0000000000000000 <u8_to_u64>:
   0:   48 c7 c0 ff 00 00 00    mov    rax,0xff
   7:   48 89 46 01             mov    QWORD PTR [rsi+0x1],rax
   b:   48 c7 c0 ee 00 00 00    mov    rax,0xee
  12:   48 89 47 01             mov    QWORD PTR [rdi+0x1],rax
  16:   48 31 c0                xor    rax,rax
  19:   c3                      ret

注意[rsi+1][rdi+1]寻址模式。

您要执行的GAS语法是:
mov   byte ptr [rsi], 0xff
mov   byte ptr [rdi], 0xee
xor   eax,eax
ret

或通过愚蠢的额外说明先对寄存器进行mov-immediate:
mov   eax, 0xff
mov   [rsi], al
mov   eax, 0xee     # mov al, 0xee  is shorter but false dependency on the old RAX
mov   [rdi], al
xor   eax,eax
ret

10-08 01:16