我有一个简单的代码,它使用scipy.stats.gaussian_kde函数生成一个二维高斯核。
这里是MWE

def random_data(N):
    # Generate some random data.
    return np.random.uniform(0., 10., N)

# Data lists.
x_data = random_data(10000)
y_data = random_data(10000)

# Obtain the KDE for this region.
kernel = stats.gaussian_kde(np.vstack([x_data, y_data]), bw_method=0.05)

结果是:
我需要的是获取KDE中最大值的x,y坐标的方法。
对于我可以从各种来源收集到的,找到最大值的直接方法似乎是在精细网格上评估kernel,然后只使用np.argmax找到它,见下面:
# define grid.
xmin, xmax = min(x_data), max(x_data)
ymin, ymax = min(y_data), max(y_data)
x, y = np.mgrid[xmin:xmax:100j, ymin:ymax:100j]
positions = np.vstack([x.ravel(), y.ravel()])

# THIS IS TOO SLOW.
k_pos = kernel(positions)

# Print max value.
print k_pos[np.argmax(k_pos)]

# Print x,y coordinates of max value.
print positions.T[np.argmax(k_pos)]

这样做的问题是,评估内核的速度非常慢,几乎到了不能用于不太大的数据集的地步。
有没有更好的方法得到最大值的坐标?
也被接受(可能更好,因为它也允许快速绘制):有没有一种更快的方法来评估精细网格中的内核?

最佳答案

np.argmax(kernel)

可能是你要找的…
见:http://docs.scipy.org/doc/numpy/reference/generated/numpy.argmax.html

09-25 21:41