我有以下设置:

fword = "don"
comment_true = "Don is bad. Don't eat nails. Carl&Don. Don&Carl. Don, Don."
comment_false = "Don't do this"
replace_with = "[ANONYMISED]"


首先,我想检查fword是在comment_true还是comment_false中。

接下来,我想用fword替换replace_with

结果字符串应为:

comment_true:

"[ANONYMISED] is bad. Don't eat nails. Carl&Don. Don&Carl. [ANONYMISED], [ANONYMISED]."

comment_false:

"Don't do this"

目前,我正在使用的第一个任务是:

 True if re.search(r'\b%s\b' % fword, comment) else False


对于第二项任务,我正在使用

re.compile(r"\b%s\b" % fword, re.IGNORECASE).sub(replace_with, comment)


但是,对于这个问题,它们是不够的,因为诸如“不要”或“卡尔&唐”这样的收缩部分是匹配的。这个问题不是简单的空格检查,因为我只需要转义一些符号。

请参阅此处的示例:
https://regexr.com/42bc8

我该如何实现?

最佳答案

试试正则表达式:(?:^|(?<=\s))don(?=,|\.|\s|\Z)

Demo

关于python - 请勿在python中替换包含撇号或&的单词,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/53102511/

10-12 04:01