杨文强
- 作品数:2 被引量:5H指数:1
- 供职机构:北京大学数学科学学院更多>>
- 发文基金:国家教育部博士点基金国家自然科学基金更多>>
- 相关领域:生物学理学更多>>
- 隐马尔可夫模型与剪切位点识别
- 识别编码基因序列是生物信息学中的一个公开问题。基因识别的关键是预测出基因结构中外显子(exon)与内含(intron)之间的剪切位点(splicing site)。本文引入统计学中的隐马尔可夫过程,对剪切位点中的供点(d...
- 杨文强邓明华钱敏平
- 关键词:生物信息论隐马尔可夫模型VITERBI算法剪切位点
- 文献传递
- 基于隐马氏模型对编码序列缺失与插入的检测(英文)被引量:5
- 2002年
- 在基因组测序工作完成后 ,利用计算工具进行基因识别以及基因结构预测受到了越来越多人的重视 .人们开发了大量的相关应用软件 ,如GenScan ,Genemark ,GRAIL等 ,这些软件在寻找新基因方面提供了很重要的线索 .但基因的识别和预测问题仍未得到完全解决 ,当目标基因的编码序列有缺失和插入时 ,其预测结果和基因的实际结构相差很大 .为了消除测序错误对预测结果的影响 ,希望能找出编码序列区的测序错误 .基于这种想法 ,尝试根据DNA序列的一些统计特性 ,利用隐马尔科夫模型 (HiddenMarkovModel) ,引入缺失和插入状态 ,然后用Viterbi算法 ,从中找出含有缺失和插入的外显子序列片段 .在常用的Burset/Guigo检测集进行检测 ,得到的结果在外显子水平上 ,Sn (sensitivity)和Sp (specificity)均达到 84%以上 .
- 杨文强钱敏平HUANG Da-Wei
- 关键词:基因识别隐马尔科夫模型VITERBI算法