我尝试了以下但
s = '白云区H(52)077楼盘'
''.join(re.findall(u'([\u4e00-\u9fff0-9a-zA-Z]|(?<=[0-9])[^\u4e00-\u9fff0-9a-zA-Z]+(?=[0-9]))', s))
但是我得到了
白云区H52)077楼盘
而不是白云区H52077楼盘
正确的方法是什么?
谢谢。
最佳答案
据我了解,您可以执行以下操作:
print(re.sub(u'[^\w\s]', '', s))
哪个输出:
白云区H52077楼盘
关于python - 使用正则表达式删除标点符号,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/56412191/