我已经开始使用gephi来帮助我显示数据集。
数据集包含:

标签(某张图片的术语)作为节点

这些标签之间的标准化Google相似度距离,即权重为边缘(0到1之间)的边缘

每个标签都与其他所有标签相连,只要它们都属于同一张图片即可。因此,每张图片我都有一个节点和边缘的群集。

现在,我已按照以下格式将此数据集导入了gephi:

节点:id,标签

边缘:目标,来源,权重(0到1之间)

像500个节点和6000个边。

我现在的问题是,在导入所有这些节点和边之后,该图看起来有点像是没有实际顺序的束。每个图片的每个群集都混合到其他图片的其他群集中。
现在使用模块化作为划分算法(应该使用Louvain方法),图形将着色,每种颜色表示一张图片。现在,我可以使用Force Atlas 2布局来拆分此混乱状态。

我现在有一个带有15个簇的彩色图形(每个簇代表1张图片)

现在,我想根据标签的标准化谷歌距离(边缘的权重)使用标签(节点)再次对这些群集进行聚类,然后应将其含义等同的标签分类。

我希望你们能理解我想要实现的目标。
我还可以上传一个图片来进行说明。

非常感谢

最佳答案

我认为您不能使用Gephi的标准版本来做到这一点。您将需要开发一个插件来实现流程的最后一步。

Gephi非常适合可视化和浏览图形,但是(目前)在处理拓扑属性方面有更完善的工具。例如,igraph库(在C,R和python中可用)可能更适合您。请注意,您可以使用与Gephi和igraph都兼容的文件格式,这使您可以在同一数据上使用这两种工具。

08-25 05:54