许涛
- 作品数:2 被引量:4H指数:1
- 供职机构:西北工业大学计算机学院更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于离散时序基因表达数据的双聚类算法被引量:1
- 2013年
- 目前应用于基因表达数据上的双聚类算法大多是基于真实数据提出的,因此易受噪声干扰,且这些算法很少考虑样本间的时序性。提出了一种有效的时间点连续的双聚类挖掘算法DTCB,从离散的时序基因表达数据中挖掘出时间点连续的最大共表达双聚类。该算法使用了一种新的数据离散化方法,同时提出了三种在离散数据集下基因间的共表达关系;为了提高挖掘效率,DTCB使用了有效的剪枝和输出策略,可以在不产生候选集的情况下一次性挖掘出所有的最大共表达双聚类。通过实验分析,证明DTCB具有高效的性能和良好的鲁棒性,且结果具有较好的统计和生物意义。
- 许涛尚学群杨蜜静王淼
- 关键词:共表达离散化
- 面向时序基因表达数据的双聚类算法被引量:3
- 2013年
- 对某种生物而言,在某段连续时间内共表达的基因预示着其在同时完成某一生物过程或其间存在某种调控关系;而目前在基因表达数据上的大多数双聚类算法都是针对非连续样本点的情况提出的,对于连续样本点(样本之间存在顺序关系)的情况很少涉及。因此在考虑连续样本点的情况下,提出了一种在时序基因表达数据上挖掘极大一致趋势共表达基因集的双聚类算法TCBicluster。在每个时间点产生行常量共表达基因集,进而构造以时间点为顶点、以相邻时间点间满足一致性要求的共表达基因集为边的权值图,并采用扩展连续时间点的方式对权值图进行双聚类挖掘,使用有效的剪枝策略提高算法效率。实验证明,TCBicluster算法比RAP及CC-TSB算法更能有效挖掘极大一致趋势共表达双聚类且具有较高的效率和良好的可扩展性。
- 杨蜜静尚学群许涛王淼
- 关键词:基因共表达