我正在尝试将Python 2脚本转换为Python3。如何使用Unicode处理Regex?
这就是我在Python 2中的工作原理,它替换了«和»的引号:text = re.sub(ur'"(.*?)"', ur'«\1»', text)
我有一些非常复杂的程序,“ ur”使它变得如此简单。但这在Python 3中不起作用:text = re.sub(ur'ه\sایم([\]\.،\:»\)\s])', ur'ه\u200cایم\1', text)
最佳答案
默认情况下,Python3中的所有字符串都是unicode。只需删除u
,就可以了。
在Python2中,默认情况下,字符串是字节列表,因此我们使用u
将其标记为unicode字符串。