您好,尝试与KPrototypes集群时遇到了一些麻烦。我的数据集具有以下结构;

0  1    2    3    4    5
1  0.3  1.2  2.2  4.4  4.4
2  1.2  1.4  1.5  2.5  4.1
3  1    0    1    0    1
4  0    1    0    1    0


我的代码如下:

from kmodes.kprototypes import KPrototypes
test=KPrototypes(n_clusters=2, init='Huang')
cluster=test.fit_predict(X, categorical=[3,4])


我的问题是我似乎无法在代码中定义类别虚拟变量。 Categorical = [3,4]引用第三和第四列而不是行。

任何人都有建议如何定义行而不是列?

最佳答案

KPrototypes希望将列作为变量。您可以转置X,但请注意,列索引从零开始,因此对于上面的示例,您将拥有:

cluster=test.fit_predict(X.T, categorical=[2,3])

关于python - 用KPrototypes进行聚类,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/47141314/

10-12 19:32