我有(非常大)数量的数据点,每个数据点都包含一个 x 和 y 坐标以及一个 sigma 不确定性(sigma 在 x 和 y 方向上都相同;所有三个变量都是浮点数)。对于每个数据点,我想在标准网格上生成一个二维数组,实际值在该位置的概率。
例如,如果 x=5.0, y=5.0, sigma=1.0, 在 (0,0)->(9,9) 网格上,我希望生成:
[ 0. , 0. , 0. , 0. , 0. , 0. , 0. , 0. , 0. , 0. ],
[ 0. , 0. , 0. , 0. , 0. , 0. , 0. , 0. , 0. , 0. ],
[ 0. , 0. , 0. , 0. , 0. , 0. , 0. , 0. , 0. , 0. ],
[ 0. , 0. , 0. , 0. , 0.01, 0.02, 0.01, 0. , 0. , 0. ],
[ 0. , 0. , 0. , 0.01, 0.06, 0.1 , 0.06, 0.01, 0. , 0. ],
[ 0. , 0. , 0. , 0.02, 0.1 , 0.16, 0.1 , 0.02, 0. , 0. ],
[ 0. , 0. , 0. , 0.01, 0.06, 0.1 , 0.06, 0.01, 0. , 0. ],
[ 0. , 0. , 0. , 0. , 0.01, 0.02, 0.01, 0. , 0. , 0. ],
[ 0. , 0. , 0. , 0. , 0. , 0. , 0. , 0. , 0. , 0. ],
[ 0. , 0. , 0. , 0. , 0. , 0. , 0. , 0. , 0. , 0. ]]
上面是通过创建一个带有零的 numpy 数组生成的,并且 [5,5] = 1,然后应用
ndimage.filters.gaussian_filter
的 sigma 为 1。我觉得我可以通过分布在附近的整数值和得到一个很好的近似值。然而,以这种方式获得我的结果数组感觉过于矫枉过正,因为 scipy 必须考虑所有值,而不仅仅是位置 [5, 5] 中的 1,即使它们都是 0。它只需要 300us一个 64x64 的网格,但是,我仍然想知道是否没有更有效的方法来获得具有任意 x、y 和 sigma 的高斯内核的 X*Y numpy 数组。
最佳答案
一个相当快的方法是注意高斯是可分离的,因此您可以计算 x
和 y
的一维高斯,然后取外积:
import numpy as np
import matplotlib.pyplot as plt
x0, y0, sigma = 5.5, 4.2, 1.4
x, y = np.arange(9), np.arange(9)
gx = np.exp(-(x-x0)**2/(2*sigma**2))
gy = np.exp(-(y-y0)**2/(2*sigma**2))
g = np.outer(gx, gy)
g /= np.sum(g) # normalize, if you want that
plt.imshow(g, interpolation="nearest", origin="lower")
plt.show()