我一直在寻找将unicode代码点转换为utf8的方法。
到目前为止,我已经知道我可以手动执行操作或使用iconv。
我还认为wctomb可以工作,但是不行:
#include <stdio.h>
#include <stdlib.h>
#include <arpa/inet.h>
#define CENTER_UTF8 "\xf0\x9d\x8c\x86"
#define CENTER_UNICODE 0x1D306
int main(int argc, char** argv)
{
puts(CENTER_UTF8); //OK
static char buf[10];
int r;
#define WCTOMB(What) \
wctomb(NULL,0); \
r=wctomb(buf,What); \
puts(buf); \
printf("r=%d\n", r);
//Either one fails with -1
WCTOMB(CENTER_UNICODE);
WCTOMB(htonl(CENTER_UNICODE));
}
有人可以向我解释为什么wctomb不会将Unicode代码点转换为utf8。我在使用utf8语言环境的Linux上。
最佳答案
在使用wctomb()
之前,您应该正确更改程序的语言环境:
#include <locale.h>
/* ... */
setlocale(LC_ALL, "");
这将根据您的环境设置程序区域设置。 man setlocale
附言实际上,
LC_CTYPE
就足以满足wctomb()
的需要。