我在学习Linux x64中的SIMD(SSE)编程。。
我想将一个数组短类型分配给另一个短数组类型var。
但执行结果是错误的
这是我的消息来源。什么是问题?

#include <stdio.h>
#include <emmintrin.h>

int main( int argc, char* argv[] )
{
    short sArrayA[8] = {1,2,3,4,5,6,7,8};
    short sArrayB[8] = {0,0,0,0,0,0,0,0};

    __asm__ __volatile__(
       "movdqu %1, %%xmm0\n\t"
       "movdqu %%xmm0, %0"
       :"=g"(sArrayB)
       :"x"(sArrayA)
       :"%xmm0"
    );

    printf("sArrayB : %d, %d, %d\n", sArrayB[0], sArrayB[1], sArrayB[2] );
    return 0;
}

结果是:
sArrayB : -13600, -24676, 32767

最佳答案

使用intrinsic而不是乱搞内联asm:

#include <stdio.h>
#include <emmintrin.h>

int main(int argc, char* argv[])
{
    short sArrayA[8] = {1,2,3,4,5,6,7,8};
    short sArrayB[8] = {0,0,0,0,0,0,0,0};

    __m128i v = _mm_loadu_si128((__m128i *)sArrayA);
    _mm_storeu_si128((__m128i *)sArrayB, v);

    printf("sArrayB : %d, %d, %d\n", sArrayB[0], sArrayB[1], sArrayB[2]);
    return 0;
}

输出:
sArrayB : 1, 2, 3

关于c - gcc内联simd汇编错误:短型movdqu指令,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/36541217/

10-09 17:17