我已经开始使用gephi来帮助我显示数据集。
数据集包含:
标签(某张图片的术语)作为节点
这些标签之间的标准化Google相似度距离,即权重为边缘(0到1之间)的边缘
每个标签都与其他所有标签相连,只要它们都属于同一张图片即可。因此,每张图片我都有一个节点和边缘的群集。
现在,我已按照以下格式将此数据集导入了gephi:
节点:id,标签
边缘:目标,来源,权重(0到1之间)
像500个节点和6000个边。
我现在的问题是,在导入所有这些节点和边之后,该图看起来有点像是没有实际顺序的束。每个图片的每个群集都混合到其他图片的其他群集中。
现在使用模块化作为划分算法(应该使用Louvain方法),图形将着色,每种颜色表示一张图片。现在,我可以使用Force Atlas 2布局来拆分此混乱状态。
我现在有一个带有15个簇的彩色图形(每个簇代表1张图片)
现在,我想根据标签的标准化谷歌距离(边缘的权重)使用标签(节点)再次对这些群集进行聚类,然后应将其含义等同的标签分类。
我希望你们能理解我想要实现的目标。
我还可以上传一个图片来进行说明。
非常感谢
最佳答案
我认为您不能使用Gephi的标准版本来做到这一点。您将需要开发一个插件来实现流程的最后一步。
Gephi非常适合可视化和浏览图形,但是(目前)在处理拓扑属性方面有更完善的工具。例如,igraph库(在C,R和python中可用)可能更适合您。请注意,您可以使用与Gephi和igraph都兼容的文件格式,这使您可以在同一数据上使用这两种工具。