蛋白质-蛋白质相互作用网络是已知的。它是无向图。网络的每一行都是这样(蛋白质2-蛋白质6),它代表蛋白质2和蛋白质6之间的相互作用。
networks:
Protein 2 - Protein 6
Protein 4 - Protein 5
Protein 6 - Protein 5
Protein 5 - Protein 7
...
在该网络中,某些蛋白质的功能是已知的,而功能相似的蛋白质往往是相关的。
The function of some proteins:
Protein 2,Func_002
Protein 2,Func_007
Protein 2,Func_008
Protein 3,Func_007
Protein 3,Func_008
Protein 3,Func_009
Protein 4,Func_011
Protein 5,Func_015
...
并且已知蛋白质的一部分是癌症相关蛋白质。
The known proteins:
Protein 4,Cancer
Protein 6, Cancer
Protein 7, Cancer
Protein 10, Cancer
...
但是,无论与癌症有关的蛋白质还是与非癌症有关的蛋白质,绝大多数蛋白质都是未知的。您如何使用已知的癌症相关蛋白来预测该蛋白是否是癌症相关蛋白?
我不知道如何解决这个问题。
最佳答案
看看PageRank算法。
例如。使用+1初始化癌症,使用-1初始化nonCancer,然后执行功效迭代,直到变化小于阈值1e-10。
那些体重正的人与癌症蛋白更相关。
关于graph - 如何用无向图中的已知信息进行预测,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/34672692/