您的位置: 专家智库 > >

国家自然科学基金(61272138)

作品数:3 被引量:6H指数:1
相关作者:周烜王珊薛忠斌王雪更多>>
相关机构:中国人民大学更多>>
发文基金:国家自然科学基金中国人民大学科学研究基金教育部“新世纪优秀人才支持计划”更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 3篇中文期刊文章

领域

  • 3篇自动化与计算...

主题

  • 3篇数据库
  • 2篇吞吐
  • 1篇时空数据
  • 1篇时空数据库
  • 1篇题组
  • 1篇吞吐量
  • 1篇批处理
  • 1篇主存
  • 1篇内存
  • 1篇内存数据
  • 1篇内存数据库
  • 1篇范围查询
  • 1篇查询
  • 1篇查询算法
  • 1篇处理系统
  • 1篇大规模数据
  • 1篇大规模数据库
  • 1篇大数据

机构

  • 3篇中国人民大学

作者

  • 3篇周烜
  • 2篇王珊
  • 2篇薛忠斌
  • 1篇王雪

传媒

  • 1篇华东师范大学...
  • 1篇计算机学报
  • 1篇软件学报

年份

  • 1篇2015
  • 1篇2014
  • 1篇2013
3 条 记 录,以下是 1-3
排序方式:
批处理在内存数据处理系统中的应用被引量:1
2014年
内存数据处理相较磁盘数据处理有明显的速度优势.在基于磁盘的数据管理系统中,设计者往往会花很多精力对事务响应时间进行调优,以提高应用的用户体验.在内存数据管理系统中,由于存储介质的改变,事务响应时间得到极大提升,甚至远远超出应用系统的需求.因此,系统设计者将注意力转移到对吞吐率的优化上.批处理技术的本质是通过牺牲响应时间换取吞吐率,它将在内存计算中得到广泛应用.本文讨论批处理方式在内存数据管理系统中的应用,并以移动对象管理为实际案例,验证批处理在内存数据管理中的优化效果.
周烜薛忠斌
关键词:内存数据库批处理
混合的大规模数据库自动模式抽象方法被引量:4
2013年
随着数据库规模的扩大,其模式的复杂度也不断地增加,复杂的模式和文档的缺乏使得理解和操作数据库更加困难.现有的模式抽象方法大多通过关系表中的主外键信息查找出模式中最重要的表,然后使用这些最重要的表来构成单层次的模式总结.在现实应用中,这些模式总结的主题并不明确.文中陈述了现有方法的不足,然后给出了一种为大规模数据库生成多层次模式抽象的方法.在此方法中,首先使用不同类型的社区社团检测算法来将数据库模式划分为"团",然后使用元聚类方法将这些"团"集成为数据库的主题组,每一个主题组代表数据库的一个主题.最后将这些主题组进行进一步的聚类以生成主题组类,并为每一个主题组类挑选标签以生成多层次的模式抽象.在Freebase——开源的大规模数据库上验证了文中算法的有效性.实验证明文中算法不仅能够精确地识别大规模数据库的主题,同时可以依据数据库的主题生成易于理解、能够帮助用户浏览和检索数据库的多层次模式抽象.
王雪周烜王珊
关键词:大规模数据库
双流模式下高吞吐量移动对象范围查询算法被引量:1
2015年
随着位置感知移动设备的出现及通信技术和GPS系统的不断发展,基于位置的查询在数据库领域得到了广泛的关注.研究了基于快照的空间范围查询,即,查询在某个时间段位于某个查询范围内的移动对象.范围查询是其他空间查询的基础,例如KNN查询和反KNN查询等,很容易在范围查询的基础上得到.国内外的研究者针对移动对象的范围查询问题提出了一系列的算法,然而这些算法要么关注于解决移动对象的快速更新问题,要么关注于解决范围查询的快速处理问题.在大数据的背景下,查询和更新大量涌入时,不仅要求查询算法有较快的响应速度,还要求它们能够实现较高的吞吐量,但已有算法不能很好地解决高吞吐量的问题.针对移动对象更新数据流和查询数据流,提出一种基于内存的高吞吐量移动对象范围查询算法——双向流连接(DSJ)算法.双向流连接算法采用基于快照的模式,通过在每个快照中重新构建索引的方式,以避免复杂的索引维护操作,充分发挥了硬件的性能;通过每次执行一组查询的方式,增加了数据的局部性,提高了算法的效率;在执行过程中,通过使用SIMD技术以加速查询处理过程.基于以上几点,双向流连接算法能够确保整个系统具有很高的吞吐量.在基于德国路网生成的数据集上对算法进行了测试,实验结果表明,双向流连接算法具有很好的性能表现.
薛忠斌周烜王珊
关键词:大数据时空数据库范围查询主存
共1页<1>
聚类工具0