我有以下设置:
fword = "don"
comment_true = "Don is bad. Don't eat nails. Carl&Don. Don&Carl. Don, Don."
comment_false = "Don't do this"
replace_with = "[ANONYMISED]"
首先,我想检查
fword
是在comment_true
还是comment_false
中。接下来,我想用
fword
替换replace_with
。结果字符串应为:
comment_true:
"[ANONYMISED] is bad. Don't eat nails. Carl&Don. Don&Carl. [ANONYMISED], [ANONYMISED]."
comment_false:
"Don't do this"
目前,我正在使用的第一个任务是:
True if re.search(r'\b%s\b' % fword, comment) else False
对于第二项任务,我正在使用
re.compile(r"\b%s\b" % fword, re.IGNORECASE).sub(replace_with, comment)
但是,对于这个问题,它们是不够的,因为诸如“不要”或“卡尔&唐”这样的收缩部分是匹配的。这个问题不是简单的空格检查,因为我只需要转义一些符号。
请参阅此处的示例:
https://regexr.com/42bc8
我该如何实现?
最佳答案
试试正则表达式:(?:^|(?<=\s))don(?=,|\.|\s|\Z)
Demo
关于python - 请勿在python中替换包含撇号或&的单词,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/53102511/