我正在处理有时会产生噪声尖峰的RF信号。
输入是这样的:00000001111100011110001111100001110000001000001111000000111001111000
在解析信号中的数据之前,我需要删除尖峰位,这些尖峰位是0和1的序列,长度小于(在此示例中)3。

所以基本上我需要匹配0000000111110001111000111110000111000000(1)000001111000000111(00)1111000匹配之后,我将其替换为之前的位,因此干净的信号如下所示:00000001111100011110001111100001110000000000001111000000111111111000
到目前为止,我使用两种不同的Regex实现了此目的:

self.re_one_spikes = re.compile("(?:[^1])(?P<spike>1{1,%d})(?=[^1])" % (self._SHORTEST_BIT_LEN - 1))
self.re_zero_spikes = re.compile("(?:[^0])(?P<spike>0{1,%d})(?=[^0])" % (self._SHORTEST_BIT_LEN - 1))

然后,我反复进行比赛并替换。

如何使用单个正则表达式执行此操作?我可以使用正则表达式来替换不同大小的匹配项吗?
我尝试了类似的尝试,但没有成功:
re.compile("(?![\1])([01]{1,2})(?![\1])")

最佳答案

import re
THRESHOLD=3

def fixer(match):
    ones = match.group(0)
    if len(ones) < THRESHOLD: return "0"*len(ones)
    return ones

my_string = '00000001111100011110001111100001110000001000001111000000111001111000'
print(re.sub("(1+)",fixer,my_string))

如果您还想删除零的“尖峰”
def fixer(match):
    items = match.group(0)
    if len(items) < THRESHOLD: return "10"[int(items[0])]*len(items)
    return items

print(re.sub("(1+)|(0+)",fixer,my_string))

关于python - 正则表达式消除比特信号噪声尖峰,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/39519207/

10-12 21:54