胡钢清
- 作品数:4 被引量:2H指数:1
- 供职机构:北京大学工学院生物医学工程系更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划更多>>
- 相关领域:生物学轻工技术与工程农业科学医药卫生更多>>
- 原核基因翻译起始位点预测的新方法(英文)被引量:2
- 2008年
- 翻译起始位点(TIS,即基因5′端)的精确定位是原核生物基因预测的一个关键问题,而基因组GC含量和翻译起始机制的多样性是影响当前TIS预测水平的重要因素.结合基因组结构的复杂信息(包括GC含量、TIS邻近序列及上游调控信号、序列编码潜能、操纵子结构等),发展刻画翻译起始机制的数学统计模型,据此设计TIS预测的新算法MED-StartPlus.并将MED-StartPlus 与同类方法 RBSfinder、GS-Finder、MED-Start、TiCo 和Hon-yaku等进行系统地比较和评价.测试针对两种数据集进行:当前14个已知的TIS被确认的基因数据集,以及300个物种中功能已知的基因数据集.测试结果表明,MED-StartPlus的预测精度在总体上超过同类方法.尤其是对高GC含量基因组以及具有复杂翻译起始机制的基因组,MED-StartPlus具有明显的优势.
- 胡钢清刘永初郑晓斌杨一帆余振苏朱怀球
- 关键词:原核生物基因预测
- 致病性大肠杆菌CFT073菌株基因组的再注释
- 当前著名的公共核酸数据库GenBank对致病性大肠杆菌CFF073菌株的基因注释存在很大的质量问题。本文通过BLAST的相似性比较进行筛选,在5,379个GenBank注释的编码ORF(开放阅读框)中确定了4,330个可...
- 胡钢清朱怀球
- 关键词:大肠杆菌基因组注释BLAST
- 文献传递
- 基于复杂系统方法的基因结构分析--原核基因翻译起始位点预测及其基因组比较研究
- 胡钢清
- 致病性大肠杆菌UPEC CFT073全基因组分析及致病机制的新认识
- 2009年
- 尿道致病性大肠杆菌UPEC CFT073菌株(uropathogenic Escherichia coli CFT073)于2002年被完全测序并注释。但是,对其基因组的研究还很不完善,首先表现在基因组注释的系统性错误和滞后性。作者运用一系列生物信息学方法和工具,从编码蛋白质基因、编码RNA基因等角度对RefSeq数据库的基因组注释进行了系统的修正和增补,并在此基础上鉴别了一批新的候选致病因子基因。进一步的分析表明,得到的基因组注释对CFT073致病相关的一些重要调控关系和机制能够给出更准确、完整的描述。
- 罗成伟胡钢清朱怀球
- 关键词:ESCHERICHIACOLI基因注释致病因子