黑龙江省自然科学基金(zjg03-05)
- 作品数:9 被引量:5H指数:2
- 相关作者:李建中王宏志高宏张春鹤王洪强更多>>
- 相关机构:哈尔滨工业大学中国人民大学更多>>
- 发文基金:国家自然科学基金黑龙江省自然科学基金哈尔滨市科技攻关计划项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于区间编码的图结构XML数据上DAG匹配算法被引量:2
- 2006年
- 图结构的XML数据被越来越多地应用在实践中,相关的问题也随之而生 .传统的XML树模型处理算法和图结构模型处理技术并不能够有效地处理图结构XML数据上的DAG查询 .提出了一种基于可达性区间编码的GraphJoin算法,利用区间桶这种数据结构,直接对图结构XML数据上的DAG查询进行全局匹配 .理论分析和实验结果表明,这种算法在查询时间和执行效率上好于现有的技术.
- 张春鹤李建中王宏志高宏
- 关键词:XML
- EasyQuerier:一种基于关键词的Web集成查询接口
- 2006年
- Web集成系统中接口集成是重要的环节之一.而现有的接口集成方法主要集成各个网站提供的高级搜索接口,这样建立的集成接口由于包含过多的属性,而在一些属性上可供用户选择的候选值更是非常繁杂,不便用户的查询使用.设计了基于关键词的集成接口EasyQuerier,用户只需要给出查询相关的几个关键词,避免了浏览复杂的查询接口.为EasyQuerier设计的查询实现方法证实了这种集成接口的可用性.实验证明,用户提交到EasyQuerier的查询可以准确地被理解,并得到正确的查询结果.
- 李忺刘伟孟小峰
- 关键词:WEB基于关键词查询转换
- 动态图结构XML数据上的查询处理算法
- XML数据可以用图结构模型来表示.在实际应用中,这种图结构的数据会进行动态更新.目前,对于图结构XML数据上的更新操作并没有正式的定义,而且对于动态XML上查询处理的研究还很少.详细地讨论了图结构XML数据上的更新操作,...
- 张春鹤李建中王宏志
- 关键词:XML图结构
- 文献传递
- 分布式复式数据流的处理
- 在分布式数据流环境中,系统的通信带宽是一种瓶颈资源.在保证查询精度的前提下,为了有效地减少网络中数据流的传输量,提出了一种新的数据流传输方式,称为复式数据流.复式数据流方法是将分布式数据流系统中的原始数据流分组合并成复式...
- 张冬冬李建中王伟平郭龙江
- 关键词:分布式数据流通信带宽
- 文献传递
- 三级存储系统中一种高效的连接算法
- 2007年
- 第3级存储器的联机使用为海量数据管理提供了一种廉价可行的方案.为了使数据库管理系统能够联机使用第3级存储设备,第3级存储设备上的关系操作算法,特别是连接操作算法是必须解决的关键问题之一.提出一种高效的连接算法.实验结果表明,该算法无论在性能方面还是在扩展性方面都优于以往算法,极大地减少了I/O代价.当数据量较大时,算法的性能不低于基于磁盘的连接算法.结果表明,第3级存储器可以像磁盘一样在海量数据库系统中联机使用,解决海量数据库存储和联机查询等关键问题.
- 刘宝良李建中高宏
- 基于滑动窗口的数据流压缩技术及连续查询处理方法
- 基于滑动窗口的连续查询处理是数据流研究领域的一个热点问题.已有的研究工作均假设滑动窗口内的数据能够全部保存在主存中,若滑动窗口内的数据量超过了可用主存空间,已有的查询处理方法则无法正常工作.提出两种数据流上的滑动窗口压缩...
- 王栩李建中王伟平
- 关键词:连续查询数据流
- 文献传递
- 支持第三级存储器的查询优化方法的研究
- 2008年
- 目前的关系数据库代价模型及查询优化算法无法处理保存在第三级存储器中的海量数据.提出了估算第三级关系代数操作的代价模型,通过定义若干基本数据访问模式及两种模式合成方法的代价,导出关系代数操作的代价.提出了针对第三级存储器的查询优化方法,该方法不仅可以选择最高效的关系代数操作实现算法,而且可以选择I/O代价最小的关系副本,从而提高查询效率.实验结果表明,应用提出的代价模型及查询优化方法后可以显著地提高第三级存储器上数据的查询效率.关系副本的引入充分证明了用存储空间换取查询执行时间的策略的可行性.
- 刘宝良李建中高宏
- 关键词:查询优化数据访问模式
- 基于素数序列标记法的XML查询处理算法
- 2009年
- XML索引为查询处理提供了高效的帮助,其中F&B索引是已知的处理分枝查询的最小的索引,但快速创建F&B索引和利用F&B索引完成查询处理的算法却很少有人研究.本文提出了一种素数序列标记法,这种标记法不仅有助于快速的建立F&B索引,更可以高效的完成F&B索引上的查询处理.此外,我们还给出了基于素数序列标记法的查询处理算法,即素数整除匹配算法,该算法可以高效的判定某节点是否有某分枝子结构.实验表明基于素数序列标记法的F&B索引创建方法比SAM算法快,在多个数据集F&B索引上素数整除匹配算法优于关联路径连接算法和Tw igStack算法.
- 王洪强李建中王宏志
- 关键词:XML索引
- SAJ:以最小化空间代价为目标的F&B索引构建算法被引量:1
- 2006年
- F&B索引及其相关技术是XML结构化索引研究方面的热点问题.利用树模型XML文档特有的结构性质,以最小化空间代价为目标,提出了一种新的F&B索引创建算法.该算法以后根顺序遍历XML文档,通过合并节点构建F&B索引,避免了将整个文档读入内存,极大地减少了构建索引需要的空间.理论分析和实验结果表明,该算法在创建索引过程中拥有很好的时空性能,有利于F&B索引的广泛应用.
- 刘显敏李建中王宏志刘雨洋骆吉洲
- 关键词:XML
- 基于F&B索引的XML查询处理算法被引量:2
- 2010年
- XML已成为信息交换和表示的标准.对XML数据的查询将返回满足特定约束的XML节点子集.对于大文件的XML数据的查询处理通常分为两步:1.为该XML数据建立一个索引;2.在索引上完成查询处理无需访问源文档.XML索引为查询处理提供了高效的帮助,其中F&B索引是已知的处理分枝查询最小的索引,但快速创建F&B索引和利用F&B索引完成查询处理的算法却很少有人研究.提出了一种素数序列标记法,这种标记法不仅有助于快速地建立F&B索引,更可以高效地完成F&B索引上的查询处理.此外,还给出了F&B索引上的区间标记法与CCPI的创建过程,这两种编码创建过程无需在建立F&B索引后二次创建,仅需与F&B索引创建过程一起对文档使用SAX解析器分析一次即可得到.这样,可以在F&B索引的区间标记法上使用TwigStack算法执行查询处理,在F&B索引的CCPI标记法上使用关联路径连接算法执行查询处理.还给出了基于素数序列标记法的查询处理算法,即素数整除匹配算法,该算法可以高效地判定某节点是否有某分枝子结构.实验表明基于素数序列标记法的F&B索引创建方法比SAM算法快,在多个数据集F&B索引上素数整除匹配算法优于关联路径连接算法和TwigStack算法.
- 王洪强李建中王宏志
- 关键词:XML索引