国家自然科学基金(60970085)
- 作品数:4 被引量:2H指数:1
- 相关作者:徐云潘玮华聂鹏宇陈波李婷更多>>
- 相关机构:中国科学技术大学安徽省高性能计算重点实验室国家高性能计算机工程技术研究中心更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术生物学更多>>
- 生物序列数据K-mer频次统计问题的算法
- 2014年
- 生物序列的k-mer频次统计是生物信息处理中一个非常基础且重要的问题.本文针对多序列在对齐模式下,不同偏移处一段长度范围内的k-mer频次统计问题进行了研究.提出了一种逆向遍历k-mer计数算法BTKC.该算法能够充分利用长度的k-mer统计信息,快速得到长度的k-mer统计信息,从而避免了统计任意长度的k-mer频次信息时都需要对所有序列进行遍历.算法的时间复杂度分析及实验结果表明,相比于传统的前向遍历FTKC算法,BTKC算法性能提升非常明显,且其时间复杂度与k-mer长度的变化范围无关,非常适合于在k-mer长度变化范围较大的情况下使用.
- 张鑫鑫陈波何继凌徐云
- 关键词:生物信息处理
- 一种跨平台的并行编程框架设计与实现被引量:1
- 2014年
- 并行程序设计的复杂性及并行计算平台的多样性导致程序可移植性较差。为此,设计并实现一种跨平台、分层次的并行编程框架OpenCH。该框架通过两层并行函数库和层次化的API设计,对上层应用程序隐藏并行化细节,为基于不同计算平台的库函数设计了统一的函数接口,使底层平台的变化对上层应用程序透明。根据底层函数库的开发,给出一种填充式的编程方法和任务调度系统。将OpenCH应用于遥感影像分类,实验结果证明,基于该框架开发的并行程序可运行于多种并行计算平台,并具有较高的并行加速比,编程框架本身造成的时间开销低于15%。
- 李婷徐云聂鹏宇潘玮华
- 关键词:并行计算跨平台MPI编程
- 一种基于聚类的大规模单体分型算法
- 2013年
- 大规模单体分型问题是生物遗传分析领域一个重要的基础性问题。针对现有算法求解大规模单体分型问题时存在的缺陷,在原有WinHAP算法的基础上引入聚类思想,提出一种基于聚类的WinHAP算法。该算法在保证原算法精度不下降的前提下,大大提高了算法的计算速度,降低了空间消耗,并具有空间需求与序列条数无关这一优良特性,因此特别适合处理超大规模的数据集。在SIMD共享存储模型下对算法进行了并行化,并设计了基于贪心的线程任务分配策略,获得了接近线性的加速比。
- 潘玮华陈波徐云
- 关键词:聚类并行计算生物信息学
- 基于仿射聚类的宏基因组序列物种聚类被引量:1
- 2013年
- 随着下一代测序技术的迅猛发展,宏基因组学已经成为新的研究热点,宏基因组学序列聚类问题使用无参考的方法,对包含多个物种的宏基因组序列进行有效分离.为此,提出一种结合相似度信息和结构信息的宏基因组物种聚类算法,并引入仿射聚类来进行序列物种聚类.实验数据表明该方法聚类精度高、执行速度快.我们也开发了基于该方法的宏基因组序列物种聚类软件.
- 聂鹏宇潘玮华徐云
- 关键词:宏基因组学DNA序列倒排索引