假设我有一个这样的 np.array:

a = [1, 3, 4, 5, 60, 43, 53, 4, 46, 54, 56, 78]

是否有一种快速方法可以获取 3 个连续数字都高于某个阈值的所有位置的索引?也就是说,对于某些阈值 th ,获取所有 x ,其中包含:
a[x]>th and a[x+1]>th and a[x+2]>th

示例:对于阈值 40 和上面给出的列表,x 应该是 [4,8,9]

非常感谢。

最佳答案

方法 #1

在比较后得到的 bool 数组的掩码上使用 convolution -

In [40]: a # input array
Out[40]: array([ 1,  3,  4,  5, 60, 43, 53,  4, 46, 54, 56, 78])

In [42]: N = 3 # compare N consecutive numbers

In [44]: T = 40 # threshold for comparison

In [45]: np.flatnonzero(np.convolve(a>T, np.ones(N, dtype=int),'valid')>=N)
Out[45]: array([4, 8, 9])

方法 #2

使用 binary_erosion -
In [77]: from scipy.ndimage.morphology import binary_erosion

In [31]: np.flatnonzero(binary_erosion(a>T,np.ones(N, dtype=int), origin=-(N//2)))
Out[31]: array([4, 8, 9])

方法 #3(特定情况):少量连续数字检查

为了检查如此少量的连续数字(在这种情况下为三个),我们还可以在比较掩码上使用 slicing 以获得更好的性能 -
m = a>T
out = np.flatnonzero(m[:-2] & m[1:-1] & m[2:])

基准测试

来自给定样本的 100000 重复/平铺数组的计时 -
In [78]: a
Out[78]: array([ 1,  3,  4,  5, 60, 43, 53,  4, 46, 54, 56, 78])

In [79]: a = np.tile(a,100000)

In [80]: N = 3

In [81]: T = 40

# Approach #3
In [82]: %%timeit
    ...: m = a>T
    ...: out = np.flatnonzero(m[:-2] & m[1:-1] & m[2:])
1000 loops, best of 3: 1.83 ms per loop

# Approach #1
In [83]: %timeit np.flatnonzero(np.convolve(a>T, np.ones(N, dtype=int),'valid')>=N)
100 loops, best of 3: 10.9 ms per loop

# Approach #2
In [84]: %timeit np.flatnonzero(binary_erosion(a>T,np.ones(N, dtype=int), origin=-(N//2)))
100 loops, best of 3: 11.7 ms per loop

关于python - 检查数组中是否有 3 个连续值高于某个阈值,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/51702622/

10-12 16:50
查看更多