我正在尝试将正则表达式写入具有以下格式的字符串
12740(34,12)[abc(a1b2c3)(a2b3c4)......] myId123
目前,我有这样的事情
\((?P<expression>\S+)\)
但是有了这个,我只能捕获方括号内的字符串。
无论如何,我可以捕获方括号之前的整数,以及结尾处的id以及方括号内的字符串。
小括号中包含的字符串数将不同。我也可以有一个像这样的字符串
10(3,2)[abc(a1b2c3)] myId1
我知道我可以使用蛮力为上述表达式编写一个简单的正则表达式。但是当方括号内的字符串数不断变化时,谁能帮我写一个。
提前致谢
最佳答案
您可以使用^
和$
捕获信息,分别表示开始和结束:
((?P<front>^\d+)|\((?P<expression>\S+)\)|(?P<id>[a-zA-Z0-9]+)$)
正则表达式101:
https://regex101.com/r/PoA5k4/1
为了使结果更有用,我将其变成字典:
import re
myStr = "12740(34,12) [abc (a1b2c3) (a2b3c4)......] myId123"
di = {}
for find in re.findall("((?P<front>^\d+)|\((?P<expression>\S+)\)|(?P<id>[a-zA-Z0-9]+)$)",myStr):
if find[1] != "":
di["starter"] = find[1]
elif find[3] != "":
di["id"] = find[3]
else:
di.setdefault("expression",[]).append(find[2])
print(di)
关于python - 正则表达式以匹配花括号中的字符串,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/43495783/