我一直在寻找将unicode代码点转换为utf8的方法。
到目前为止,我已经知道我可以手动执行操作或使用iconv。

我还认为wctomb可以工作,但是不行:

#include <stdio.h>
#include <stdlib.h>
#include <arpa/inet.h>

#define CENTER_UTF8 "\xf0\x9d\x8c\x86"
#define CENTER_UNICODE 0x1D306

int main(int argc, char** argv)
{
    puts(CENTER_UTF8); //OK
    static char buf[10];
    int r;

#define WCTOMB(What) \
    wctomb(NULL,0); \
    r=wctomb(buf,What); \
    puts(buf); \
    printf("r=%d\n", r);

    //Either one fails with -1
    WCTOMB(CENTER_UNICODE);
    WCTOMB(htonl(CENTER_UNICODE));
}

有人可以向我解释为什么wctomb不会将Unicode代码点转换为utf8。我在使用utf8语言环境的Linux上。

最佳答案

在使用wctomb()之前,您应该正确更改程序的语言环境:

#include <locale.h>
/* ... */
setlocale(LC_ALL, "");

这将根据您的环境设置程序区域设置。 man setlocale



附言实际上,LC_CTYPE就足以满足wctomb()的需要。

09-19 05:07