本文介绍了如何将Unicode转义序列转换为Haskell中的Unicode字符串的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧! 问题描述 29岁程序员,3月因学历无情被辞! 我有一个像\3619\3657\3634\3609\3648\3592\3657\3648\3621\3657\3591的字符串我想解码它。我试图搜索unicode库,但没有成功。 前奏> putStrLn\3619\ 3657\\3634\\3609\\3648\\3592\\3657\\3648\\3621\\3657\\3591 请注意,您实际上没有字符串\3619\3657\3634\3609\3648\3592\3657 \ 3648\3621\3657\3591–相反,您有UTF-32字符串ร้านเจ้เล้ง,其中\3619\3657 ... Show 实例来显示结果,这并不像显示可以用作Haskell代码的文字那样显示结果。在unicode方面它是保守的。这就是为什么 另一方面, putStrLn , putChar , hPutStr 等功能只需以UTF-8格式转储字符串本身,而不是以ASCII安全表示形式。 如果您实际上是从文件或某物中读取转义字符串,您可以只需阅读即可: I have a string like "\3619\3657\3634\3609\3648\3592\3657\3648\3621\3657\3591" which I want to decode it. I tried search the unicode library without success. 解决方案 Note that you don't actually have the string "\3619\3657\3634\3609\3648\3592\3657\3648\3621\3657\3591" – rather, you have the UTF-32 string ร้านเจ้เล้ง, for which "\3619\3657..." happens to be a ASCII-compliant literal. By default, GHCi uses the Show instance to display results, which doesn't so much show things as spit out literals that can be used as Haskell code for the thing. It's conservative in terms of unicode. That's whyOn the other hand, the putStrLn, putChar, hPutStr etc. functions will just dump the string itself in UTF-8 rather than an ASCII-safe representation thereof.If you're actually reading the escaped string from a file or something, you can simply read it: 这篇关于如何将Unicode转义序列转换为Haskell中的Unicode字符串的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持! 上岸,阿里云!
07-16 08:28