王小磊 作品数:20 被引量:19 H指数:3 供职机构: 军事医学科学院卫生勤务与医学情报研究所 更多>> 发文基金: 国家高技术研究发展计划 国防科技重点实验室基金 国家自然科学基金 更多>> 相关领域: 医药卫生 生物学 自动化与计算机技术 农业科学 更多>>
基于高通量测序数据的微生物检测算法 被引量:2 2013年 目的设计一种基于高通量测序数据的功能强大、处理速度快且不依赖于运行环境的本地化的微生物检测算法。方法对微生物基因组进行分组,每次使用一组微生物基因组提取映射到其上的测序数据并滤除数据中的人类基因组数据,然后对序列进行拼接和拼接片段比对。如果根据比对结果检测出微生物种属则流程结束,否则使用下一组微生物基因组进行分析。若使用所有微生物基因组分析结束后仍未确定微生物种属,则滤除剩余的测序序列中的人类测序数据并进行拼接,拼接片段通过序列比对无法匹配到微生物基因组,则将这些拼接片段归为未知病原微生物的基因组片段。结果利用新的检测算法对模拟数据和实际测序数据进行分析,以RINS作为对比。对于已知病原微生物,新算法的平均处理时间为75 min,RINS的平均处理时间为767 min,两个算法检测结果一致,新算法得到的拼接序列更长。对于未知病原微生物样本,新算法检测的平均处理时间为64min,RINS的为584min,新算法得到了较完整的原始序列。对于实测数据,新算法的平均处理时间为23 min,RINS的为68 min,检测结果一致。结论本文实现的微生物检测算法能够对微生物进行准确、快速的检测,同时,新的检测算法可以发现未知的微生物并获取未知微生物的基因组片段。 李江域 王小磊 刘阳 毛逸清 赵东升 王玉民关键词:高通量测序 微生物检测 生物医学专题信息跟踪与服务系统关键技术的研究与应用 搜索引擎是通过互联网获取信息的主要手段之一,而垂直搜索引擎能够面向特定专业领域提供更为精确和快捷的信息服务。目前,国内外各种搜索引擎和检索系统比较多,但是都存在一定的局限性。例如,信息检索质量不高,能针对信息需求,主动提... 王小磊关键词:搜索引擎 NUTCH LUCENE 中文分词 文献传递 RNA-Seq本地分析平台的构建 被引量:2 2015年 目的:构建一个本地化的RNA-Seq数据处理分析平台,为RNA-Seq研究人员提供数据分析平台。方法:在调研现有的RNA-Seq数据分析研究成果的基础上,构建一套本地化的RNA-Seq分析平台,平台首先将测序数据中的低质量数据进行过滤,然后使用Top Hat将过滤后的数据与参考基因组数据进行比对,利用比对结果进行可变剪切分析、基因差异表达分析等,最后通过R语言工具包对分析结果进行可视化绘图。结果:通过对2组小鼠的RNA-Seq测序数据进行分析,构建的分析平台能够较好地过滤低质量测序数据,并且分析出2组数据间的差异表达基因,同时还可以图形化表示这些差异表达基因。结论:分析平台能够实现对RNA-Seq测序数据的质量控制、差异表达分析及分析结果的可视化。 李江域 陈胜 王小磊 赵东升 王玉民关键词:RNA-SEQ 高通量测序 生物信息学 面向生物医学研究的高性能计算技术现状与展望 现代生物医学研究极大地依赖于高性能计算系统。本文介绍了面向生物医学研究的高性能计算技术的国内外发展现状和基本方法,从生物医学研究需求和计算技术发展两方面探讨了目前的研究热点、关键应用和发展趋势,并提出了对未来的展望。 王小磊 毛逸清 赵东升关键词:高性能计算系统 计算生物学 生物信息学 生物医学 生物医学专题信息跟踪与服务系统的设计与实现 被引量:1 2010年 目的构建网络化的生物医学专题信息跟踪与服务系统,为科学研究和领导决策提供信息支持。方法以MyEclipse6.5、Mysql5.1、Tomcat6.0为开发工具,以J2EE轻型构架为技术支撑,应用网络爬虫、全文检索、信息推送等技术实现系统的各项功能。结果和结论生物医学专题信息跟踪与服务系统实现了对互联网上的生物安全等专题信息进行跟踪、抓取、转换、分类和入库,以及信息的快速发布、分类导航、全文检索和个性化服务,能够主动、及时地为用户提供最新的生物医学专题信息。 李立 王小磊 赵东升关键词:个性化服务 网络爬虫 信息存储和检索 构建NCBI镜像FTP数据库及其应用 被引量:2 2010年 目的建立一个FTP服务器为院内生物医学研究人员提供快速下载NCBI常用生物数据库的FTP服务。方法采用Linux系统和perl、shell程序设计,构建FTP服务系统。结果与结论系统实现了数据下载、更新、系统管理等功能,并进行了测试,目前系统已经上线服务。 毛逸清 李江域 王小磊 赵东升关键词:FTP服务器 NCBI 数据库 局部序列比对算法及其并行加速研究进展 被引量:3 2012年 随着新一代测序技术的发展,传统的序列比对工具已无法满足测序产生的海量生物学数据分析处理的需求,研究如何利用最新的计算技术加速序列比对过程具有十分重要的意义。本文回顾了常用的局部序列比对算法,介绍了基于并行计算原理的序列比对算法的加速优化策略和主要进展,详细说明了如何利用最新的图形处理器(GPU)计算技术实现高性能的BLAST(basic local alignment search tool)比对算法。最后,结合实际需求,提出和讨论了综合利用云计算和GPU计算实现高性能、高能效的序列比对平台的研究思路。 刘阳 王小磊 李江域 毛逸清 赵东升关键词:并行计算 云计算 HADOOP GPU计算 构建基于EBI数据库的本地SRS服务系统 2011年 为了建立基于EBI数据库的本地SRS服务系统,进而为生物医学研究人员提供方便、快速搜索EBI常用生物数据库的web服务,同时提供一套技术机制为其他生物医学研究机构建设自己的SRS服务系统提供参考。在Linux系统和Tomcat环境下安装调试EBI提供的SRS8.1学术版软件,并利用perl和shell程序设计语言开发EBI数据库的自动下载和定期更新模块。完成了本地SRS系统的安装和测试,实现了EBI数据库的自动下载和更新机制,目前系统已经正常运行。 毛逸清 李江域 王小磊 赵东升关键词:SRS EBI Docker技术在生物信息学中的应用 被引量:4 2016年 随着高通量测序、蛋白质组学等生物技术的迅猛发展,生物医学数据、生物信息学工具及分析应用需求均呈现出多样性和复杂性的特点。传统的生物信息计算环境如专用工作站、虚拟机等已无法较好地适应这一情况。Docker作为一种新兴的容器技术,具有轻量、开放和安全的优点,为分析和处理生物大数据提供了一种新的解决方案,得到生物信息学开发和应用人员越来越多的关注与使用。该文针对大数据时代下生物信息学工具开发、部署、应用的要求和特点,分析Docker技术在生物信息学中应用的优势,介绍了该技术在生物信息学中的具体应用案例,探讨其有待改进的方面以及未来发展趋势。 佟凡 王小磊 李江域 屈武斌 赵东升关键词:DOCKER 云计算 生物信息学 复用性 利用高通量测序数据进行微生物检测的算法研究进展 新一代高通量测序技术的发展,推动了很多相关研究领域的发展。国际上很多研究机构正在研究利用高通量测序数据进行微生物检测的算法,目前已有一些基于高通量测序数据的微生物检测算法流程设计成功并发布出来。该文调研了利用高通量测序数... 李江域 毛逸清 王小磊 赵东升关键词:高通量测序 微生物检测 生物信息学 文献传递