我正在使用python使用regex解析SDDL。SDDL总是以“type:some text”的形式重复4次。类型可以是“O”、“G”、“D”或“S”,后跟冒号。“some text”的长度是可变的。
下面是SDDL示例:

O:DAG:S-1-5-21-2021943911-1813009066-4215039422-1735D:(D;;0xf0007;;;AN)(D;;0xf0007;;;BG)S:NO_ACCESS_CONTROL

这是我目前所拥有的。其中两个元组返回得很好,但另两个元组-('G','S-1-5-21-2021943911-1813009066-4215039422-1735')和('S','NO_ACCESS_CONTROL')没有返回。
import re

sddl="O:DAG:S-1-5-21-2021943911-1813009066-4215039422-1735D:(D;;0xf0007;;;AN)(D;;0xf0007;;;BG)S:NO_ACCESS_CONTROL"

matches = re.findall('(.):(.*?).:',sddl)

print matches

[('O', 'DA'), ('D', '(D;;0xf0007;;;AN)(D;;0xf0007;;;BG)')]

我想回来的是
[('O', 'DA'), ('G','S-1-5-21-2021943911-1813009066-4215039422-1735'), ('D', '(D;;0xf0007;;;AN)(D;;0xf0007;;;BG)'),('S','NO_ACCESS_CONTROL')]

最佳答案

请尝试以下操作:

(.):(.*?)(?=.:|$)

例子:
>>> re.findall(r'(.):(.*?)(?=.:|$)', sddl)
[('O', 'DA'), ('G', 'S-1-5-21-2021943911-1813009066-4215039422-1735'), ('D', '(D;;0xf0007;;;AN)(D;;0xf0007;;;BG)'), ('S', 'NO_ACCESS_CONTROL')]

这个regex的开始方式与您的相同,但它并没有将.:作为匹配的一部分包含在结尾,而是使用了lookahead。这是必要的,因为re.findall()不会返回重叠匹配,所以您需要在下一个匹配开始之前停止每个匹配。
lookahead(?=.:|$)实质上意味着“仅当下一个字符是后跟冒号的任何字符,或者我们在字符串末尾时才匹配”。

10-01 07:02