我知道可以先匹配一个单词,然后使用其他工具(例如grep -v
)将匹配项反转。但是,可以匹配不包含特定单词的行,例如hede
,使用正则表达式?
输入:
hoho
hihi
haha
hede
码:
grep "<Regex for 'doesn't contain hede'>" input
所需的输出:
hoho
hihi
haha
最佳答案
正则表达式不支持逆匹配的说法并不完全正确。您可以使用否定环顾模仿此行为:
^((?!hede).)*$
上面的正则表达式将匹配任何包含换行符'hede'的字符串或没有换行符的行,而不是。如前所述,这不是正则表达式“擅长”(或应该做)的事情,但仍有可能。
如果还需要匹配换行符,请使用DOT-ALL modifier(以下模式中的尾随
s
):/^((?!hede).)*$/s
或内联使用:
/(?s)^((?!hede).)*$/
(其中
/.../
是正则表达式分隔符,即不是模式的一部分)如果DOT-ALL修饰符不可用,则可以使用字符类
[\s\S]
模仿相同的行为:/^((?!hede)[\s\S])*$/
说明
字符串只是
n
字符的列表。每个字符之前和之后都有一个空字符串。因此,n
字符列表将具有n+1
空字符串。考虑字符串"ABhedeCD"
: ┌──┬───┬──┬───┬──┬───┬──┬───┬──┬───┬──┬───┬──┬───┬──┬───┬──┐
S = │e1│ A │e2│ B │e3│ h │e4│ e │e5│ d │e6│ e │e7│ C │e8│ D │e9│
└──┴───┴──┴───┴──┴───┴──┴───┴──┴───┴──┴───┴──┴───┴──┴───┴──┘
index 0 1 2 3 4 5 6 7
其中
e
是空字符串。正则表达式(?!hede).
会先查看是否没有子串"hede"
,如果是这种情况(那么会看到其他情况),那么.
(点)将匹配除换行符之外的任何字符。环顾四周也称为零宽度断言,因为它们不占用任何字符。他们仅声明/验证某些内容。因此,在我的示例中,在
"hede"
(点)消耗字符之前,首先验证每个空字符串以查看前面是否没有.
。正则表达式(?!hede).
仅会执行一次,因此将它包装在一个组中,并重复零次或多次:((?!hede).)*
。最后, anchor 定输入的开始和结束以确保使用了整个输入:^((?!hede).)*$
如您所见,输入
"ABhedeCD"
将失败,因为在e3
上,正则表达式(?!hede)
失败(前面还有"hede"
!)。关于regex - 正则表达式匹配不包含单词的行,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/406230/