我有一个简单的代码,它使用scipy.stats.gaussian_kde函数生成一个二维高斯核。
这里是MWE
:
def random_data(N):
# Generate some random data.
return np.random.uniform(0., 10., N)
# Data lists.
x_data = random_data(10000)
y_data = random_data(10000)
# Obtain the KDE for this region.
kernel = stats.gaussian_kde(np.vstack([x_data, y_data]), bw_method=0.05)
结果是:
我需要的是获取KDE中最大值的
x,y
坐标的方法。对于我可以从各种来源收集到的,找到最大值的直接方法似乎是在精细网格上评估
kernel
,然后只使用np.argmax
找到它,见下面:# define grid.
xmin, xmax = min(x_data), max(x_data)
ymin, ymax = min(y_data), max(y_data)
x, y = np.mgrid[xmin:xmax:100j, ymin:ymax:100j]
positions = np.vstack([x.ravel(), y.ravel()])
# THIS IS TOO SLOW.
k_pos = kernel(positions)
# Print max value.
print k_pos[np.argmax(k_pos)]
# Print x,y coordinates of max value.
print positions.T[np.argmax(k_pos)]
这样做的问题是,评估内核的速度非常慢,几乎到了不能用于不太大的数据集的地步。
有没有更好的方法得到最大值的坐标?
也被接受(可能更好,因为它也允许快速绘制):有没有一种更快的方法来评估精细网格中的内核?
最佳答案
np.argmax(kernel)
可能是你要找的…
见:http://docs.scipy.org/doc/numpy/reference/generated/numpy.argmax.html