Clustering result集群可以在层次聚集集群中重叠。我在R中实现了距离矩阵并绘制了聚类,但结果表明,聚类彼此重叠。

library(rioja)

View(dissimilarity)

dissimilarity=as.dist(dissimilarity)

#diss=dist(dissimilarity,method='canberra')
clust1=chclust(dissimilarity,method = "coniss")     #To plot the dendogram using coniss method
#clust=chclust(dissimilarity,method = "conslink")    #To plot the dendogram using conslink method
plot(clust1,hang=-1)

#creating the hclust object to implement hierarchial clustering

hc = hclust(dissimilarity, method = 'ward.D')
y_hc = cutree(hc,6)
dissimilarity=as.matrix(dissimilarity)    #To convert diss into a data matrix
# Visualising the clusters
library(cluster)
clusplot(dissimilarity,
         y_hc,
         lines = 0,
         shade = FALSE,
         color = TRUE,
         labels= 1,
         plotchar = FALSE,
         span = TRUE,
         main = paste('Clusters'),
         )

最佳答案

重叠群集的印象可能基于可能的多维数据的2D图或功能语法的错误使用。软件包clusplot中的函数cluster使用prcompcmdscale取决于参数diss为降维时为false或true。

根据help(clusplot)diss告诉函数,是否给函数提供了相异矩阵或观察矩阵。在您的情况下,在不设置diss = TRUE的情况下为该函数提供了一个不相似矩阵。这可能是对绘图功能的错误使用。

07-27 14:04