我需要一些Utf32测试字符串来行使一些跨平台字符串操作代码。我想要一套测试字符串,这些字符串可以执行utf32 utf16 utf8编码,以验证BMP之外的字符可以从utf32,utf16替代,utf8以及反向转换。正确地。

而且,如果所讨论的字符串不仅由随机字节组成,而且实际上在它们所编码的(多种)语言中有意义,那么我总是觉得它更优雅。

最佳答案

尽管这并不是您所要求的,但我始终觉得该测试文档很有用。

http://www.cl.cam.ac.uk/~mgk25/ucs/examples/UTF-8-test.txt

同一站点提供此

http://www.cl.cam.ac.uk/~mgk25/ucs/examples/quickbrown.txt

...相当于英语的“Quick brown fox”文本,适用于多种语言,可以练习所有使用的字符。该页面引用了以前在Wikipedia上的“pangrams”的较大列表,但显然已在那里删除。在这里仍然可用:

http://clagnut.com/blog/2380/

关于c++ - 单元测试的Unicode测试字符串,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/6136800/

10-12 17:29
查看更多