吴文琪
- 作品数:2 被引量:2H指数:1
- 供职机构:北京大学更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划北京市优秀博士学位论文指导教师科技项目更多>>
- 相关领域:生物学更多>>
- 基于迭代自学习的操纵子结构预测
- 原核生物操纵子结构是原核生物转录阶段的基本单元,由共同转录的连续基因及调控这些基因转录、翻译的调控区组成。操纵子结构的准确注释对基因功能和基因调控网络的研究具有重要的意义。然而,目前实验手段获取操纵子结构昂贵且费时,通过...
- 吴文琪
- 关键词:原核生物生物调控基因表达
- 基于迭代自学习的操纵子结构预测被引量:2
- 2011年
- 原核生物操纵子结构的准确注释对基因功能和基因调控网络的研究具有重要意义,通过生物信息学方法计算预测是当前基因组操纵子结构注释的最主要来源.当前的预测算法大都需要实验确认的操纵子作为训练集,但实验确认的操纵子数据的缺乏一直成为发展算法的瓶颈.基于对操纵子结构的认识,从基因间距离、转录翻译相关的调控信号以及COG功能注释等特征出发,建立了描述操纵子复杂结构的概率模型,并提出了不依赖于特定物种操纵子数据作为训练集的迭代自学习算法.通过对实验验证的操纵子数据集的测试比较,结果表明算法对于预测操纵子结构非常有效.在不依赖于任何已知操纵子信息的情况下,算法在总体预测水平上超过了目前最好的操纵子预测方法,而且这种自学习的预测算法要优于依赖特定物种进行训练的算法.这些特点使得该算法能够适用于新测序的物种,有别于当前常用的操纵子预测方法.对细菌和古细菌的基因组进行大规模比较分析,进一步提高了对基因组操纵子结构的普遍特征和物种特异性的认识.
- 吴文琪郑晓斌刘永初汤凯朱怀球
- 关键词:基因组分析操纵子