国家自然科学基金(60752001)
- 作品数:4 被引量:23H指数:2
- 相关作者:刘志勇王凯张书彬韩冀中张法更多>>
- 相关机构:中国科学院中国科学院研究生院北京理工大学更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术天文地球更多>>
- 基于MapReduce实现空间查询的研究被引量:15
- 2010年
- 为了解决原有单机空间数据库管理系统在存储能力、计算能力和可扩展能力上的不足,在分布式文件系统的基础上设计并实现了一种基于并行计算框架MapReduce的空间矢量数据管理系统Meadow,并重点讨论了利用MapReduce并行处理空间查询的数据分割方法、副本避免方法及关键算法的设计策略,最后给出了定量的分析和论证。实验表明,相对于单机Oracle Spatial,利用MapReduce并行处理空间查询的方法具有良好的性能和近似线性的加速比。实验结果也验证了MapReduce在诸如空间数据管理系统这种基于小规模集群的计算密集型应用中同样具有良好的性能。
- 张书彬韩冀中刘志勇王凯
- 关键词:MAPREDUCE空间查询分布式系统
- 结合位点进化距离与支持向量机的蛋白质分类方法被引量:6
- 2008年
- 生物信息学的一个关键的研究课题是理解细胞的分子机制,这依赖于对基因所决定的每一条蛋白质的含义或者功能的理解.一般通过与一条或多条功能已知的蛋白质的相似性比较来推测未知蛋白质的功能,其中,基于支持向量机的一些算法取得了很好的成果.SVM-pairwise算法是当前最好的基于支持向量机的算法中的一个,该方法利用两条序列的相似性来将蛋白质序列转化为固定长度的向量.文中提出了一种新的利用支持向量机算法对蛋白质序列进行分类的方法,这种方法使用位点进化距离代替两条序列的比对得分,该方法比SVM-pairwise有着显著的改善,在蛋白质结构分类数据库(SCOP)上进行的实验表明,该方法具有比SVM-pairwise更好的分类性能.
- 李玉岗张法刘志勇
- 关键词:生物信息学内核支持向量机
- 一种大规模网络上的服务组合流程搜索方法被引量:2
- 2008年
- 集中式的自动服务组合和非平凡服务发现能够根据给定的、具有特定输入输出的请求搜索出一系列满足要求的服务组合,是当前服务计算领域的研究热点.针对集中式结构带来的性能瓶颈和单点故障问题,提出了一种利用基于内容的分布式发布订阅技术实现大规模网络环境下的无中心自动服务组合方法,称之为流程搜索.基于内容的分布式发布订阅系统能够根据发布消息和订阅消息之间的内容匹配关系,将发布者提供的消息通过一系列中介节点转发给感兴趣的订阅者.它可以为服务接口之间的可互操作性判定以及查询路由提供支持.将服务模型映射为发布订阅的消息模型,并利用基于内容的路由设计形成分布式环境下的搜索算法,并基于PADRES系统开发了一个PreSee原型系统.模拟实验显示,无中心控制的方法相对于集中式的架构而言,可以有效降低系统延迟,提高整个系统的效率.
- 虎嵩林梁英姜伟李伟
- 关键词:自动服务组合