晏春
- 作品数:8 被引量:22H指数:3
- 供职机构:国防科学技术大学机电工程与自动化学院自动化研究所更多>>
- 发文基金:国家自然科学基金军队科研计划项目更多>>
- 相关领域:生物学自动化与计算机技术更多>>
- DNA序列中模式发现的一种快速算法被引量:8
- 2005年
- 模式发现是生物信息学的一个重要研究方向,但目前的大部分算法还不能保证获得最优的模式。文章:推导了针对三个序列片段相似性关系的判据,将其作为剪枝规则,提出并实现了一种深度优先的穷举搜索算法——判据搜索算法(criterionsearchalgorithm,CRISA),理论分析表明,对绝大多数模式发现问题,CRISA具有多项式的计算时间复杂度和线性的空间复杂度。对仿真的和实际的生物序列数据的测试也表明,CRISA能够快速而完全地识别出序列中所有的模式,具有优于其它算法的总体评价,能够应用于实际的模式发现问题。
- 李冬冬王正志杜耀华晏春
- 关键词:判据深度优先搜索
- 蚂蚁群落优化算法在蛋白质折叠二维亲-疏水格点模型中的应用被引量:4
- 2004年
- 氨基酸的亲疏水格点模型是研究蛋白质折叠的一种重要的简化模型,其优化问题是一个非确定型的多项式问题。采用蚂蚁群落优化算法对这一问题进行了研究,对测试数据的计算结果表明,在一定规模下,此算法能够有效地获得亲-疏水格点模型的最优解,其效率优于传统的MonteCarlo仿真等方法。
- 李冬冬王正志杜耀华晏春
- 关键词:蛋白质折叠MONTE
- 基于支持向量机的人类5'非翻译区剪接位点识别被引量:7
- 2005年
- 基因非编码区域剪接位点的识别是基因识别中一个非常具有挑战性的问题,尤其是5'非翻译区中剪接位点的识别。与一般剪接位点不同,5'非翻译区剪接位点的两侧不存在由编码到非编码的状态转移,所以通常的剪接位点识别算法在非翻译区的性能不太理想。文章采用了基于支持向量机的方法对5'非翻译区中的剪接位点进行识别。为了提高识别精度,采用了基于矩阵相似性度量的核函数参数选取方法,它能够简单快速地确定合适的核函数参数,进而提高核函数的识别性能。通过实验验证,经过参数选择后的支持向量机能够较好地识别5'非翻译区剪接位点。
- 晏春杜耀华高青斌王正志
- 关键词:支持向量机核函数参数选择
- HumGene:一个基于GHMM的人类基因预测软件被引量:1
- 2004年
- HumGene是一个采用广义隐Markov模型(GHMM)的人类基因预测软件.利用人类基因的结构特点,采用概率模型为基因结构中各个特定区域建立了独立的子模型,能够获得全局统一的评价指数,使得系统整体框架具有一定的扩展性.采用一种新的简化算法,有效地降低了计算的复杂度.介绍了软件的构成,对软件进行了测试,给出了与其它类似软件的结果比较.
- 李冬冬晏春杜耀华王正志
- 关键词:可扩展性基因预测
- 基于改进的Winnow算法的剪接位点识别被引量:1
- 2005年
- DNA序列功能位点的识别是目前生物信息学领域的一个研究热点,剪接位点的识别就是其中之一.为了充分利用剪接位点的特征模式,从而更好地识别剪接位点,建立了一个基于改进Winnow算法的剪接位点识别系统.与其他方法相比较,改进的Winnow算法具有更好的鲁棒性,适用于高维特征空间,能够融合多种模式信息,即使在包含很多不相关特征的情况下,也能有很好的性能.同时在训练的时候,对特征集进行了剪枝,把一些对识别几乎没有贡献的特征去除,这样做对结果的影响可以忽略,而且提高了算法的效率.通过实验验证,改进的Winnow算法可以很好地识别剪接位点,其多个性能指标达到或超过目前国际上流行的剪接位点识别软件.
- 晏春倪青山杜耀华王正志
- 关键词:剪接位点识别信息融合
- 基于支持向量机的生物序列分析
- 2006年
- 支持向量机是一种比较新的机器学习方法,它满足结构风险最小的要求,并且能够适用于高维的特征空间,因此在生物序列分析中得到了广泛地应用。结合基因序列的特点,提出了一种新的核函数--位置权重子序列核函数。这个核函数融合了基因序列中子序列的组成特征和位置信息,能够比较充分地体现序列特征。将这个核函数用于基因剪接位点的识别分析,得到的结果表明,采用了位置权重子序列核函数的支持向量机能够很好的识别剪接位点,与其它方法相比,取得了更高的识别精度。
- 晏春王正志
- 关键词:支持向量机核函数生物序列分析
- 基因短序列模式分析及其在5’剪接位点识别中的应用被引量:1
- 2006年
- 短序列模式分析是基因序列分析的一个重要组成部分,在进行生物信号识别的时候,一般都会利用到短序列模式的信息。通常短序列模式的数目很多,如果每个都应用到生物信号识别中,会产生大量的参数,而且无法体现信号的主要特征。为了找出在识别信号位点中起关键作用的短序列模式,以信息增益作为评价依据,按照逐步选择的策略,将模式进行排队。根据排队结果,选取信息增益突出的短序列模式作为识别生物信号的关键依据,这样可以用较少的模式得到较好的结果。结合选取的短序列模式,用最大熵模型作为信号序列真实分布的估计,从而对给定序列进行识别。最后将这个方法用于5’剪接位点的识别,得到了满意的结果。
- 晏春杜耀华王正志
- 关键词:最大熵模型
- 基因剪接的信号序列分析和相关特征研究
- 生物信息学是信息科学与生命科学的交叉学科,随着生物技术和计算机技术的迅猛发展,生物信息学已经成为目前最为活跃的新型学科之一。剪接是基因转录过程中的一个重要步骤,其得到的序列直接决定了翻译的产物——蛋白质,而选择性剪接机制...
- 晏春
- 关键词:生物信息学基因剪接剪接位点识别隐MARKOV模型支持向量机
- 文献传递