大部分生物过程由蛋白质复合物实现。蛋白质相互作用数据集中大量存在的假阳性降低了数据集的可用性。为了减轻假阳性带来的不良影响,许多数据整合与亲缘打分方案被设计。这些方案通过给蛋白质网络中的边(蛋白质之间的相互作用)指定权值,从而提高了蛋白质网络的可信度。目前的挑战是如何从加权的蛋白质网络中挖掘新的有生物学意义的蛋白质复合物。为了解决这一问题,提出了一种新的蛋白质复合物挖掘算法BFSWD(breadth first search with weighted density)。该算法以加权密度为条件,从单个蛋白质(种子)出发,广度优先搜索加权蛋白质网络,进而构建蛋白质复合物。实验结果表明,在蛋白质复合物挖掘方面,BFSWD算法优于其他类似的方法。
蛋白质复合物是许多生物过程得以实现的基石。蛋白质相互作用数据中的假阳性和假阴性对各种识别蛋白质复合物的计算方法有不良影响。为了解决这一问题,1种新的蛋白质复合物识别算法(ICMDS,Identifying Complexes based on Multiple Data Sources)被提出。该方法整合基因表达谱、关键蛋白质信息和蛋白质相互作用3种生物数据进行蛋白质复合物的挖掘。首先,ICMDS重新定义了2个相互作用的蛋白质之间的功能相似性(FS,Functional Similarity)。然后,ICMDS选择已知的关键蛋白质作为种子构建蛋白质复合物。为了消除冗余的复合物,ICMDS算法也设计了冗余过滤子程序。另外,ICMDS也使用非关键蛋白质作为种子并将之扩展为蛋白质复合物。实验结果表明ICMDS识别蛋白质复合物的能力明显优于其他计算方法。