胡华梁
- 作品数:8 被引量:18H指数:3
- 供职机构:浙江理工大学经济管理学院更多>>
- 发文基金:浙江省自然科学基金国家自然科学基金上海市教育委员会创新基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 集群资源统一管理和调度技术综述被引量:6
- 2014年
- 随着互联网的快速发展和大数据的来临,基于数据密集型应用的集群计算框架不断涌现,并且这些计算框架都只面向某一类特定领域的应用.基于这一特点,互联网公司往往需要部署和运行多个计算框架,从而为每个应用选择最优的计算框架.因此,资源统一管理和调度系统作为集群共享平台被提出来.集群资源统一管理和调度系统需要同时支持多种不同计算框架,如何管理集群计算资源和不同计算框架间的资源公平分配成为关键技术难点.不同计算框架的作业是异构的,如何在不同框架间进行作业调度,以充分利用集群资源和提高系统吞吐量,成为了新的挑战.本文针对现有的资源管理系统和应用需求特点,研究和分析了集群资源管理和调度的关键技术,并对现有的集群资源管理技术存在的问题和未来发展进行了探讨.
- 李永峰周敏奇胡华梁
- 关键词:资源管理系统资源共享作业调度
- OceanBase一致性与可用性分析被引量:2
- 2014年
- OceanBase作为一个面向海量数据查询的分布式数据库,支持关系查询和跨行跨表事务,同时保证了一致性和可用性.本文在详细阐述了一致性与可用性的背景基础上,根据传统数据库和分布式数据库保证一致性和可用性的协议和策略,对OceanBase的一致性和可用性架构进行分析.最后,探讨了基于OceanBase架构演变而来的3种架构的实现方案.
- 周欢樊秋实胡华梁
- 关键词:分布式数据库一致性可用性
- OceanBase一致性与可用性分析
- OceanBase作为一个面向海量数据查询的分布式数据库,支持关系查询和跨行跨表事务,同时保证了一致性和可用性.本文在详细阐述了一致性与可用性的背景基础上,根据传统数据库和分布式数据库保证一致性和可用性的协议和策略,对O...
- 周欢樊秋实胡华梁
- 关键词:分布式数据库
- 文献传递
- 面向OLAP应用的OceanBase模式设计
- 2014年
- 随着大数据时代的来临,用户查询需求也越来越复杂,对数据库的可扩展性和SQL查询效率都提出了很高的要求.OceanBase是Alibaba研发的适应互联网规模的关系型分布式数据库,能够做到可扩展、低成本、高可用,并能应用到很多业务场景,包括OLTP和OLAP.然而,当前发布的最新OceanBase只支持主键索引,还不能支持二级索引.其次,OceanBase在连接上没有并行处理,使得查询效率较低.因此,为了能够使用主键索引及减少连接来加快查询速率,OceanBase模式设计是必要的.本文主要以TPC-H的22个查询为OLAP的研究案例,分析传统数据库的模式设计,并提出OceanBase分布式数据库下的模式设计规则,最后将会通过实验来验证这套模式设计规则的有效性.
- 顾伶翁海星胡华梁赵琼
- 关键词:OLAPTPC-H
- 如何客观评测内存数据库的性能
- 2014年
- 在过去的10年间,随着硬件技术不断发展,内存价格越来越低,许多计算机系统均布置了大容量内存.数据库系统开发商和研究人员认识到这一趋势,并开发出多款内存数据库产品,其特点在于先将数据装载到内存之中,再执行相应的数据管理任务.随着内存数据库的出现,如何客观、公正地评测它的性能显得愈发重要.尽管当前不乏关于关系型数据库系统的评测基准,例如威斯康星测试基准和TPC-X系列等,但是这些基准并未充分考虑内存数据库的重要特性,因此不适合评测内存数据库.本文提出了一种面向内存数据库的评测基准(InMemBench),与传统的关系数据库基准显著不同,它综合考虑了内存数据库特有的数据预取过程、物理组织方式和压缩能力等方面的重要特点.最后,本文还通过新基准比较了4款内存数据库的性能.
- 康强强金澈清张召胡华梁周傲英
- 关键词:内存数据库
- 图书垂直搜索引擎的设计被引量:3
- 2007年
- 图书垂直搜索引擎是当前专业搜索引擎的重要组成部分。本文对传统图书搜索引擎存在的问题(信息内容形式单一、缺少个性化服务和用户体验效果差)进行了分析,提出相应的解决方案,并对其中的部分关键技术进行了研究。最后,对相关的实现进行了细化。
- 胡华梁何进钟元生
- 关键词:图书搜索引擎系统设计
- 面向OLAP应用的OceanBase模式设计
- 随着大数据时代的来临,用户查询需求也越来越复杂,对数据库的可扩展性和SQL查询效率都提出了很高的要求.OceanBase是Alibaba研发的适应互联网规模的关系型分布式数据库,能够做到可扩展、低成本、高可用,并能应用到...
- 顾伶翁海星胡华梁赵琼
- 关键词:分布式数据库联机事务处理系统海量数据
- 文献传递
- 集群环境下分布式索引的实现被引量:7
- 2016年
- 针对分布式存储系统上使用非主键访问数据带来的性能问题,探讨在分布式存储系统上实现索引的相关关键技术。在充分分析分布式存储特征的基础上,提出了分布式索引设计和实现的关键点,并结合分布式存储系统的特点及相关的索引技术,讨论了索引的组织形式、索引的维护和数据一致性等问题;然后基于如上的分析,选择在分布式数据库系统OceanBase开源版本上,设计和实现分布式索引机制,并通过基准测试工具YCSB进行性能测试。实验结果表明,虽然辅助索引会对系统性能产生影响,但因为充分考虑了系统特征及存储特点,在不同数据规模下,该索引都能够将性能影响控制在5%以内。另外,使用冗余列的方式,能进一步将该索引的性能提升100%。
- 翁海星宫学庆朱燕超胡华梁
- 关键词:分布式存储分布式索引