您的位置: 专家智库 > >

孔令波

作品数:4 被引量:204H指数:3
供职机构:北京大学信息科学技术学院计算机科学技术系更多>>
发文基金:国家高技术研究发展计划北京市自然科学基金国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 3篇期刊文章
  • 1篇学位论文

领域

  • 4篇自动化与计算...

主题

  • 3篇关键字
  • 3篇关键字查询
  • 3篇查询
  • 2篇信息检索
  • 2篇索引
  • 2篇XML数据
  • 2篇XML索引
  • 2篇XML信息检...
  • 2篇XPATH
  • 2篇DEWEY编...
  • 2篇XQUERY
  • 1篇索引技术
  • 1篇向量
  • 1篇向量空间
  • 1篇向量空间模型
  • 1篇XML查询
  • 1篇XML关键字
  • 1篇XML关键字...
  • 1篇L模型
  • 1篇查询技术

机构

  • 4篇北京大学

作者

  • 4篇孔令波
  • 3篇王腾蛟
  • 3篇杨冬青
  • 3篇唐世渭
  • 3篇高军

传媒

  • 3篇软件学报

年份

  • 2篇2007
  • 1篇2006
  • 1篇2005
4 条 记 录,以下是 1-4
排序方式:
XML数据索引技术被引量:96
2005年
对XML数据建立有效的索引,是左右XML数据处理性能的重要因素.深入地讨论了目前XML索引技术的研究现状,将XML索引技术分为两大类:节点记录类索引(本身还可以分为3个小的类型)和结构摘要类索引.根据XML数据查询处理效率以及XML数据修改对XML索引的要求,讨论了相关XML索引方法的优点和不足,并归结出XML索引后续研究的3个方向:XML结构信息的获取,路径信息的多维处理,数据修改合法性的有效支持,以及涉及能够同时有效满足XML查询和信息获取的索引.
孔令波唐世渭杨冬青王腾蛟高军
关键词:XML索引
XML数据的查询技术被引量:106
2007年
XML规范已成为当前网络应用(包括数字图书馆、Web服务以及电子商务)中事实上的数据表达、交换的标准.针对XML数据的查询在当前XML数据管理研究中占有重要的地位,也是当前XML数据处理研究领域的热点方向,相关的研究文献有很多.根据查询模式描述的不同,将当前XML查询技术归入两大类:XML Query方式和XML IR方式.后者又进而可分以为3个子类:XML IR/keyword方式、XML IR/fragment和XMLIR/query方式,并从中挑选出3个研究者关注的问题进行了简述,它们是:Twig查询模式的处理、SLCA(smallest lowest common ancestor)节点的获取以及对所获取的XML片段相似性的度量.以方便普通用户使用为准则探讨了相关XML查询技术的优、缺点,将如下4个问题作为需要进一步关注的研究内容:结构化关键字查询及相应的结构相似性度量方法,如何消除XML Query查询处理模式(包含XML IR/query)和XML IR/keyword查询处理模式间数据冗余的问题,XML Query查询方式的理论探讨及其实现以及针对特定应用的XML数据的有效管理.
孔令波唐世渭杨冬青王腾蛟高军
关键词:XML查询XPATHXQUERYXML关键字查询XQUERYDEWEY编码
XML数据关键字查询研究
XML(可扩展标签语言)已成为当前基于网络应用的数据表达、交换的标准,设计并实现针对XML数据的有效管理机制也就成为几个相关研究领域所关注的热点,例如数据库领域,Web服务,电子商务和信息检索领域等。针对XML数据查询的...
孔令波
关键词:信息检索XPATHXQUERYXML信息检索关键字查询向量空间模型
XML信息检索中最小子树根节点问题的分层算法被引量:28
2007年
最小子树根节点问题(smallest lowest common ancestor,简称SLCA)是实现XML信息检索研究中关键字查询的一个基本问题,其主旨就是求解所有包含给定关键字的紧致子树的根节点.XU等人给出了3种算法—基于索引的搜索算法(indexed lookup eager,简称ILE)、基于堆栈的算法以及基于扫描的算法(scan eager,简称SE),并通过实验证明ILE算法具有最好的表现.与基于B+树索引结构的ILE算法不同,所给出的新算法,称为LISA(layered intersection scan algorithm)方法.该方法基于SLCA节点按“层”分布的规律,采取了逐层求解SLCA节点的思路,即在获取了包含关键字的节点的Dewey码集合后,通过计算对应于不同关键字、不同层次的Dewey码前缀集合的交集,可以得到对应不同层的SLCA节点.与ILE相比,LISA除了只需对应于关键字的节点集合信息以外,不再需要其他复杂的辅助数据结构——全部的信息只是对应不同关键字的Dewey码集合以及排序操作.同时,给出了两种实际的算法:LISAI和LISAII,二者的区别在于是否采用Dewey编码到整数的转换.其中,LISAII更具有满意的性能.
孔令波唐世渭杨冬青王腾蛟高军
关键词:XML索引DEWEY编码XML信息检索关键字查询
共1页<1>
聚类工具0