我正在尝试查找巨大数据集的5000个中心点。我的输入数组是[5000000] [512],表示很多具有512维的 vector 。 C++对数组大小有限制,我似乎无法克服这一点。我想使用opencv kmeans函数。
任何的想法???
最佳答案
上面的人同意。真正的问题是,您是否真的拥有如此庞大的内存的笔记本电脑/台式机。如果答案是肯定的,则只需编写C程序即可完成工作。否则,您可能必须找出一种分布式解决方案,例如Hadoop上的Mahout。另一个选择是,您可能希望以某种方式从所有数据中获取样本,并在样本上进行聚类(如果您的要求可以接受)。
关于c++ - Kmeans种类繁多,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/17850403/