我正在尝试使用Python中的正则表达式匹配有效域名内的标签:
DOMAIN_LABEL_RE = """
\A(
(?<![\d\-]) # cannot start with digit or hyphen, looking behind
([a-zA-Z\d\-]*?)
([a-zA-Z]+)# need at least 1 letter
([a-zA-Z\d\-]*?)
(?!\-) # cannot end with a hyphen, looking ahead
)\Z
"""
我正在尝试使用肯定和否定断言来避免在标签的开头或结尾使用连字符。
但是字符串“ -asdf”仍然匹配:
e.match(DOMAIN_LABEL_RE,“ -asdf”,re.VERBOSE).group()
我不明白为什么它仍然匹配。
谢谢你的帮助。
M.
最佳答案
\A
匹配字符串的开头,并且如果后面没有连字符,则后面的后面匹配。
您位于字符串的开头,当然它前面没有字符!
请改用否定的前瞻:(?![\d\-])
。
字符串末尾类似。您必须在后面使用负向后搜索(?<!\-)
。
我认为与您当前的表达式相同的表达式是:
DOMAIN_LABEL_RE = """
(?i # case insensitive
\A(
([a-z]) # need at least 1 letter and cannot start with digit or hyphen
([a-z\d-]*?)
(?<!-) # cannot end with a hyphen
)\Z
)
"""
注意:我没有检查表达式是否真正适合您要解决的问题。
关于python - 前瞻性断言,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/7037799/