我正在做一项涉及“无监督分类”的研究。
基本上,我有一个trainSet,我想以无监督的方式将数据集中在X个类中。想法类似于k-means的作用。

比方说

步骤1)
featureSet是一个[1057x10]矩阵,我想将它们分为88个集群。

第2步)
使用先前计算的类来计算testData的分类方式


-是否可以使用SVM或N-N来完成?还要别的吗 ?
-还有其他建议吗?

最佳答案

那里有很多聚类算法,网络上充斥着有关它们的信息和示例实现。 Wikipedia关于聚类分析Cluster_analysis的条目是一个很好的起点。

当您有一个可行的k-means实现时,您可以尝试多种变体之一,以查看它们是否可获得更好的结果(也许是k-means ++,就像您提到的SVM一样)。如果您想要一种完全不同的方法,请查看Kohonen Maps,也称为自组织特征图。如果这看起来太棘手,那么将很容易实现简单的分层聚类(找到最近的两项,合并,冲洗和重复)。

08-19 20:17