如果文件包含英镑符号,则directory_iterator正确返回utf8字符序列\ xC2 \ xA3

wdirectory_iterator使用宽字符,但仍返回utf8序列。这是wdirectory_iterator的正确行为,还是我使用不正确?

AddFile(testpath, "pound£sign");
wdirectory_iterator iter(testpath);
TS_ASSERT_EQUALS(iter->leaf(),L"pound\xC2\xA3sign"); // Succeeds
TS_ASSERT_EQUALS(*iter, L"pound£sign"); // Fails

最佳答案

宽字符(wchar_t对象)的编码取决于实现。为了使第二条语句(即L“ pound£sign”)生效,您可能需要更改基础语言环境。默认值为“ C”,它不知道井号字符。十六进制值成功,因为这不需要将字形映射到特定编码中的值。

注意:为简洁起见,我跳过了标准w.r.t wchar_t,扩展字符集等的确切措辞。

08-25 08:18