覃雄派
- 作品数:58 被引量:1,127H指数:6
- 供职机构:中国人民大学信息学院更多>>
- 发文基金:国家自然科学基金中央高校基本科研业务费专项资金国家科技重大专项更多>>
- 相关领域:自动化与计算机技术文化科学自然科学总论电子电信更多>>
- BPConfigurer:一种快速自动配置多缓冲区的方法
- 1引言DBMS技术的发展,一方面使其应用越来越广泛,但另一方面,为满足各种各样的应用,数据库本身变得越来越庞大,复杂,参数越来越多,在这种情况下,完全靠手工对数据库进行管理变得越来越困难,企业对数据库的总体拥有成本(To...
- 冷建全冯玉王珊覃雄派
- 关键词:BUFFER
- 文献传递
- 日志数据的存储方法及系统
- 本发明涉及计算机技术领域,公开了一种日志数据的存储方法及系统,所述方法包括:将日志数据按照所属实体簇的不同划分为多个日志记录分片;将各个日志记录分片分别写入分布式消息队列的不同主题;采用多线程方式,将所述分布式消息队列的...
- 陈跃国覃雄派杜小勇金国栋丛一鸣刘阳
- 一种分布式文件列存储索引方法
- 本发明公开了一种分布式文件列存储索引方法,该方法包括下述步骤:解析查询语句获得查询条件;根据查询条件中的索引字段读取索引副本列,所述索引副本列是在列存储引擎的Stripe内对索引字段进行排序后复制构成,包括列值和列值所在...
- 覃雄派陈跃国杜小勇赵丽萍
- 文献传递
- 面向Flash Memory的高性能数据存储引擎的研究
- 2009年
- 传统的数据存储引擎对Flash Memory数据的修改是通过页内更新技术实现的,这将导致FlashMemory的性能下降及其磨损加剧。针对该问题,文章提出了一种面向Flash Memory的采用页外更新技术的多版本数据存储引擎MV4Flash。该数据存储引擎采用多版本存储和垃圾回收机制,所有数据的更新和修改都通过文件追加的方式进行,适应了Flash Memory先擦除后写入的特点,延长了设备寿命。采用NDBBench对该数据存储引擎进行测试的结果表明,MV4Flash与传统的InnoDB相比,事物处理性能有较大的提升,更适合于数据规模大、实时性要求高的应用系统。
- 周晓云覃雄派徐钊
- 关键词:MEMORY多版本垃圾回收NDBBENCH
- 面向大规模机群的可扩展OLAP查询技术被引量:8
- 2015年
- 大数据时代,由中低端硬件组成的大规模机群逐渐成为海量数据处理的主流平台之一.然而传统基于高端硬件平台设计的并行OLAP查询算法并不适应这种由不可靠计算单元组成的大规模并行计算的环境.为改善其在新计算环境下的的扩展性和容错性,该文对传统数据仓库的数据组织模式及处理模式进行改造,提出了全新的无连接雪花模型和TRM执行模型.无连接雪花模型基于层次编码技术,将维表层次等关键信息压缩进事实表,使得事实表可以独立处理数据,从数据模型层保证了数据计算的独立性;TRM执行模型将OLAP查询的处理抽象为Transform、Reduce、Merge 3个操作,使得OLAP查询可被划分为众多可并行执行的独立子任务,从执行层保证了系统的高度可扩展特性.在性能优化方面,该文提出了Scan-index扫描和跳跃式扫描算法,以尽可能地减少I/O访问操作;设计了并行谓词判断、批量谓词判断等优化算法,以加速本地计算速度.实验表明:LaScOLAP原型可以获得较好的扩展性和容错性,其性能比HadoopDB高出一个数量级.
- 王会举覃雄派王珊张延松李芙蓉
- 关键词:OLAP查询
- 多维直方图的动态空间管理
- 本文从空间管理角度讨论在函数依赖或者近似函数依赖的情况下,多维直方图如何在给定的空间预算内,通过在多维直方桶和单值桶之间有效地动态分配和管理空间,大大提高空间预算的利用率,进而提高多维直方图的准确性。实验验证了动态空间管...
- 曹巍王秋月覃雄派王珊
- 关键词:多维直方图
- 文献传递
- 日志数据分片与查询方法及装置
- 本发明提供一种日志数据分片与查询方法及装置。该方法包括:获取日志数据中各个实体的编码,并对每个实体编码进行哈希操作,获取一个数据分片,然后对每个数据分片中的日志信息按照日志信息的实体的编码进行顺序排序,获取数据分组列表,...
- 陈跃国覃雄派杜小勇卞昊穹
- 文献传递
- 扩展知识图谱上的实体关系检索被引量:4
- 2016年
- 现有文本数据集上的实体搜索和自然语言查询方法无法处理需要将分散在不同文档中的信息碎片链接起来以满足有复杂实体关系的查询,而知识库上的查询虽然可以表示实体间的复杂关系,但由于知识库的异构性和不完全性,通常查全率较低。针对这些问题,提出使用文本数据集对知识库进行扩展,并设计相应的含文本短语的三元组模式查询以支持对知识库和文本数据的统一查询。在此基础上,设计并实现了查询放松机制和对结果元组的评分模型,并给出了高效的查询处理方法。使用YAGO、Clue Web09和其上的FACC1数据集,在三个不同的查询测试集(实体检索、实体关系检索和复杂的实体关系查询)上与两个典型相关工作作了比较。实验结果显示,扩展知识图谱上使用查询放松规则的实体关系检索系统的检索效果大大超出了其他系统,具体地在三个查询测试集上,其平均正确率均值(MAP)比其他系统分别提升了27%、37%和64%以上。
- 王秋月覃雄派曹巍覃飙
- 关键词:知识图谱
- 基于轻量数据挖掘方法的数据库锁表优化被引量:2
- 2012年
- 为了保证数据库系统在不同的负载情况下,始终提供强大的事务处理能力,必须对数据库系统进行性能优化。依赖于DBA,来分析性能数据,然后进行系统优化,在系统越来越复杂、负载持续波动的情况下是很困难的,数据库系统的自我优化,是很有前途的解决系统性能问题的技术。针对数据库锁表管理,使用基于轻量数据挖掘的优化方法,通过对性能数据的学习,建立一个能够根据锁表参数预测系统性能的神经网络预测器;在系统运行过程中,自我优化模块不断监控性能数据的变化,通过规则引擎选择需要优化的参数,利用预测器获得参数调整的幅度大小,完成参数设置,提高系统性能。实验证明,数据库系统性能获得近16%的提高。
- 周晓云覃雄派
- 关键词:规则引擎预测器数据挖掘
- 架构大数据:挑战、现状与展望被引量:622
- 2011年
- 大数据分析相比于传统的数据仓库应用,具有数据量大、查询分析复杂等特点.为了设计适合大数据分析的数据仓库架构,文中列举了大数据分析平台需要具备的几个重要特性,对当前的主流实现平台——并行数据库、MapReduce及基于两者的混合架构进行了分析归纳,指出了各自的优势及不足,同时也对各个方向的研究现状及作者在大数据分析方面的努力进行了介绍,对未来研究做了展望.
- 王珊王会举覃雄派周烜
- 关键词:大数据MAPREDUCE并行数据库