我有2500万个高维向量(例如2000维),
什么是一个有效的系统,我可以索引这些向量,
然后传入一个新的向量,并得到K个最近的向量?
我将在linux系统上运行它。

最佳答案

你可以做一个关于n维轴的n维角的索引。这将需要O(n)时间,然后你可以排序与你的首选排序在O(n)时间分钟。我猜搜索将在O(logn)时间内取出k向量+x(所做的工作量)。我认为这样的问题不存在捷径。

10-08 11:36