用中文记下这篇论文的大致意思,以防止忘了。好记性不如烂笔头!


摘要:最近的一些研究在研究社交网络或WWW。研究者都集中于研究网络的“小世界性”,“幂率分布特性”,“网络传递性”(聚类性吧)。本文提出网络的另一个特性:社团结构——社团内部链接十分紧密,社团之间链接较为稀疏。我们分别模拟数据和真实数据测试了算法,效果很好。又应用在了两个不知道社团结构的数据集上,能帮助我们更好的理解数据。

首先,介绍了小世界效应,幂率分布,聚类系数。然后说,本文我们提出了社团结构这一网络属性。总结说我们提出了一种社区检测方法并把它应用于不同的社交和生物网络中,发现比现有的放方法要好很多。当应用到其他我们不知道信息的社区中时,将能使我们更加理解网络结构和功能。

Detecting Community Structure 介绍了传统的方法:层次聚类算法。增广路径算法。这些算法在有些情况下是很没用的。

Edge ‘‘Betweenness’’ and Community Structure. 依据点介数,定义了边介数:通过边e的最短路径的条数。提出了我们算法的步骤:1.计算网络中所有边的介数2.移除 介数最高的边3.重新计算剩下网络中的边的介数4.重复第二步直到没有边剩下。

Tests of the Method

第一测试了一个计算机模拟的数据集。128个顶点。边的构造规则是这样的:社区中边与边以概率Pin连接,社区 外边与边的连接以概率Pout连接。Pin>Pout。发现当平均度Zout<6的时候,效果非常好,当Zout》=6的时候开始走下坡路。

第二个测试了一个空手道俱乐部的数据。34个定点。最后应用算法发现两个社团。与真实情况相符,只有一个分错。

Applications

应用在两个数据集上

第一个是论文合作数据集,事先不知道社团结构,应用算法之后,分出了研究数学的,研究物理的,以及研究其他的社团,很好的解释了现实现象。

第二个是食物网数据集。分出了浅海生物和深海生物。

作者还应用在了其他的好些个数据集上进行测试,有的能很好的分类出社团,有的则不能,作者的解释是:我们的算法是为稀疏的网络设计的,所以在稠密的网络中表现就不尽人意了。

Conclusions:本文我们提出了社团结构这一概念,并提出了社团发现的算法,算法应用很不错。但也有不足之处。希望我们的方法能得到扩展,1,。希望能处理加权和有向图2。希望算法的运行速度能提升。现在的事件复杂度是O(n3)。这就使得在大图中本方法不可行。

我们希望我们提出的思想和方法能在分析不同类型的网络中有更好的应用。也许进一步的应用从 用神经网络做函数聚类的决定到分析WWW的社区,还有一起其他的没有想到的。我们希望再将来看到这样的应用。

05-17 12:06
查看更多