宋怀明
- 作品数:6 被引量:12H指数:2
- 供职机构:中国科学院研究生院更多>>
- 发文基金:北京科技计划项目国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 大规模数据密集型系统的查询优化研究
- 面向事件流应用的大规模数据密集型系统得到了越来越广泛的应用,本文在分析事件流应用特征的基础上,展开了查询优化的研究。大规模系统的查询优化,不仅要加速查询的执行过程,更需要在事件流数据生命周期的各个阶段进行优化,包括对数据...
- 宋怀明
- 关键词:查询优化生命周期
- 一种数据库中间件的配置服务的研究和实现被引量:4
- 2007年
- 在基于事件流的大规模数据密集型系统中,数据可分为事件流数据和事件配置数据两大类,配置数据表示事件流的规则.在shared-nothing结构下,配置数据一般采用全复制的方式分布到各个数据库节点,用于和事件流数据的联合查询.采用全复制的配置数据,修改操作必须在所有节点上进行,数据的一致性控制和多节点的事务处理成为此类数据管理的关键问题.对配置数据的特点及其管理策略进行分析,并成功的在DBroker系统中实现了配置数据一致性控制.
- 宋怀明焦丽梅孙凝晖
- 关键词:数据库中间件分布式事务
- 大规模数据库系统中的面向服务架构研究被引量:2
- 2007年
- 为了满足复杂的大规模数据库系统所要求的简单、高效、高可靠的需求,该文定义了面向服务的架构。该架构把繁杂多变的系统模块分为多个服务模块,每个模块独立实现其功能,介绍了面向服务的架构如何处理服务间的协调、部署、通信和高可用方案,使诸多松散耦合的服务保持统一的管理和彼此间的联系,面向服务的架构大大简化了复杂的大规模数据库系统,并使整个系统的结构清晰化。
- 李慧宋怀明焦丽梅刘莹王洋王启荣
- 面向过程的测试方法在大规模数据密集型系统中的应用
- 2006年
- 针对数据密集型的大规模系统提出了一种面向过程的测试方法,它根据测试节点的不同角色,综合负载特征和资源利用情况,对大规模系统进行综合全面的分析,这不仅简化了大规模系统测试的复杂性,而且较好的屏蔽了上层应用的多样性。该方法已在一些大规模系统测试中得到了应用,及时发现了系统设计和系统设备的问题,取得了很好的效果。
- 刘莹宋怀明焦丽梅
- 关键词:数据密集型应用性能评测
- 大规模数据密集型系统中的去重查询优化
- 在大规模数据密集型系统中,海量数据分布存储在多节点,给去重查询提出了新的挑战。本文针对去重查询中可能出现的不同情况,提出了一种有效地数据分布策略和并行处理方法:即散列和直方图相结合的数据分布策略,以及异步式并行查询引擎,...
- 宋怀明安明远王洋袁春阳孙凝晖
- 关键词:数据挖掘信息检索
- 文献传递
- 大规模数据密集型系统中的去重查询优化被引量:6
- 2010年
- 针对shared-nothing结构下大规模数据密集型系统去重查询的挑战,提出了一种有效的数据分布策略和并行处理方法分别对相关属性和无关属性去重进行优化:即自适应的散列和直方图相结合的数据分布策略,以及异步式并行查询中间件.前者在数据写入时保证数据均衡,并在数据量发生倾斜时自动调整数据的分布;后者充分发掘了去重查询处理中的粗粒度流水级并行,并消除了多节点同步等待的开销,尽早地返回结果.在生产系统DBroker上的测试表明,数据分布策略极大地改善相关属性的去重查询性能,而异步式并行查询引擎能够充分发掘并行性,对不相关属性的去重查询具有显著的性能提升.
- 宋怀明安明远王洋袁春阳孙凝晖
- 关键词:数据划分