国家自然科学基金(60970063)
- 作品数:4 被引量:17H指数:2
- 相关作者:孙俊玲杨烨刘娟更多>>
- 相关机构:武汉大学河南财政税务高等专科学校郑州大学更多>>
- 发文基金:国家自然科学基金教育部“新世纪优秀人才支持计划”国家教育部博士点基金更多>>
- 相关领域:医药卫生理学轻工技术与工程自动化与计算机技术更多>>
- 基于相关分散搜索的基因表达数据双聚类
- 2014年
- 为了发现来自基因表达数据的双聚类,提出了一种相关分散搜索方法,分散搜索是一种进化技术,它以按质量和多样性指标选择的一个小解集进化为基础。该算法所用适应度函数是基于基因之间的线性相关性来检测基因的移动和缩放模式,同时为了选择正相关基因,采用了一个改进方法。该算法已用酵母细胞周期数据集、人类B细胞淋巴瘤数据集和酵母应力数据集三个真实数据集进行了测试,同时与使用基因本体数据库的CC,OPSM,ISA,BiMax和Samba等方法进行了比较。实验结果表明该算法能发现大量移动和缩放模式双聚类。
- 孙俊玲
- 关键词:分散搜索微阵列技术
- 第二代测序序列比对方法综述被引量:14
- 2012年
- 使用聚合酶合成技术的Illumina和454平台以及使用连接酶合成测序技术的SOLiD平台是目前三种主流的第二代测序平台.对第二代测序平台产生的高通量序列片段进行比对的方法一般分为两步:①预处理,②序列比对.预处理方法有两类,即基于哈希表的方法和基于后缀trie的Burrows-Wheeler转换思想.序列比对方法也可分为两类,一是空位种子片段索引,二是Smith-Waterman动态规划算法.本文使用Illumina和SOLiD两种平台产生的数据对常用的比对软件SHRiMP,MAQ,BFAST,BWA,BOWTIE等进行了单机测试,结果显示:BOW-TIE在对Illumina平台数据进行比对时,在内存使用、比对速度以及准确性等方面表现比其他几种好,BWA比较适合用于比对SOLiD平台产生的数据.在处理第二代以及以纳米孔技术为标志的第三代测序平台高通量数据时,第二代比对技术仍不能完全满足要求,本文认为以云计算为基础的新序列比对方法是未来研究和发展的一个重要方向.
- 杨烨刘娟
- 实现输出统一排名的差异共表达双聚类算法
- 2014年
- 提出了差异共表达框架和一个差异共表达评分函数,以观察到的一个双聚类基因在所属双聚类的条件下共表达和在其他条件下非共表达为基础,客观量化基因双聚类的质量.此外,还提出了一个评分函数把双聚类分层为三种类型的共表达.在实现双聚类输出统一排名中,使用提出的评分函数对这4个公认的双聚类算法在不同区域的6个实际数据集上的性能和行为进行测试.实验结果表明,在鉴别共表达双聚类方面,差异共表达框架能有效提高共表达基因双聚类质量和双聚类算法的性能.
- 孙俊玲
- 关键词:共表达