我正在尝试将Python 2脚本转换为Python3。如何使用Unicode处理Regex?

这就是我在Python 2中的工作原理,它替换了«和»的引号:

text = re.sub(ur'"(.*?)"', ur'«\1»', text)

我有一些非常复杂的程序,“ ur”使它变得如此简单。但这在Python 3中不起作用:

text = re.sub(ur'ه\sایم([\]\.،\:»\)\s])', ur'ه\u200cایم\1', text)

最佳答案

默认情况下,Python3中的所有字符串都是unicode。只需删除u,就可以了。

在Python2中,默认情况下,字符串是字节列表,因此我们使用u将其标记为unicode字符串。

10-01 01:24
查看更多