国家高技术研究发展计划(2009AA1Z134)
- 作品数:14 被引量:23H指数:4
- 相关作者:陈群娄颖李战怀王鹏韩萌更多>>
- 相关机构:西北工业大学河南科技大学西安科技大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- Ropeway:基于语义相关的XML关键字搜索引擎
- XML数据包含丰富的语义信息,但现有的大多数XML搜索引擎并未利用这一信息.如何利用XML数据的语义信息提高检索质量已成为当前研究所关注的问题.设计并实现了一个基于语义相关的XML关键字搜索引擎:Ropeway.对于用户...
- 郭文琪温馨王鹏张利军陈群李战怀
- 关键词:搜索引擎
- 文献传递
- 基于关键词距离模型的XML文档检索方法被引量:1
- 2011年
- 在信息检索中,关键词之间的距离反映了其对信息描述的集中程度,并对检索结果与用户需求的相关度产生影响。通过对XML数据固有的结构信息进行深入分析,确定了被检索数据的信息对象和信息分支的概念,并考虑以上因素建立语义距离模型。通过该模型的计算,能够更准确地计算出查询结果的相关度。实验结果证明:在真实数据集上,查询质量方面优于现有的主流算法(EASE、SLCA),同时具有较高的查询效率。
- 王鹏陈群娄颖
- 关键词:XML排序
- 基于标签序列的半结构化数据相似度度量
- 2012年
- 针对基于路径的半结构化数据结构相似度度量方法不能很好地处理路径部分相似以及忽略了元素之间兄弟关系的问题,提出一种基于频繁关联标签序列的结构相似度度量方法,该方法将半结构化数据的结构信息视为标签序列的集合,采用数据挖掘技术中频繁模式和关联项集的概念及算法,从半结构化数据中挖掘频繁关联标签序列并以此作为特征计算其结构相似度.实验结果证明:提出的基于频繁关联标签序列的半结构化数据结构相似度度量方法可以解决基于路径方法的不足,计算的结构相似度更准确、更合理.
- 张利军李战怀李宁李霞
- 关键词:数据挖掘数据管理半结构化数据结构相似度
- 基于主题概念的XML文档关键字查询算法
- 2010年
- 讨论了基于XML文档的关键字查询技术,根据XML文档结构的特点,结合关键字查询的需求,提出查询文档中主题的概念;建立XML文档的主题索引,设计出基于主题的高效查询算法.该算法依据主题索引和输入的关键字判断用户的查询主题,再根据主题执行获取最终查询的结果.在查询过程中不仅排除了查询主题不相关的关键字节点,同时也避免生成不相关的查询结果,提高了查询效率和质量.实验结果证明了该算法在绝大多数情况下的高效性.
- 娄颖李战怀王鹏陈群
- 关键词:查询算法关键字查询XML文档主题概念
- 多层次RFID数据流上复杂事件检测
- 2011年
- 针对多粒度RFID数据流复杂事件检测存在的问题,研究多粒度RFID数据流(如物品级、箱子级、托盘级)上复杂事件检测问题.提出了不同层次目标间关系的编码方案,并在此编码基础上提出了相应的复杂事件检测算法.使用编码方法表示不同层次RFID对象的关系及状态变化.首先给出了事件模型和动机实例;然后详细阐述了编码方法和复杂事件检测算法.实验结果表明提出的方法是可行和有效的.
- 彭商濂李战怀李强陈群
- 关键词:数据管理复杂事件检测射频识别素数编码
- 一种基于XML文档关键字检索的结构索引被引量:5
- 2010年
- XML数据索引对其检索效率有较大的影响。在深入分析现有XML结构索引之后,结合XML文档特点,提出了一种基于关键字检索的结构索引——LSS(Level Structure Summary)。LSS采用了把具有相同标签路径的结点进行合并的策略,具有高效判断结点之间同构异构关系的能力。实现了LSS索引生成算法CSCAN,并在LSS索引的基础上设计了XML关键字检索算法LSSearch。该算法依据LSS索引,将各个关键字的原始倒排表集合分拆成不同类型的子集合,最后在所有子集合上进行查询。实验结果表明,LSS可以帮助减少XML文档中关键字倒排表的规模,提高检索效率。
- 娄颖李战怀郭文琪陈群韩萌
- 关键词:XML关键字检索索引倒排表
- RFeel:一种RFID数据管理中间件
- 由于存在漏读、交叉读以及语义简单的原子事件,RFID系统产生的海量原始数据无法直接融合到企业现有的管理系统中.RFID中间件作为原始数据和上层应用之间的桥梁,有着非常重要的作用.开发了一种RFID数据管理中间件原型系统R...
- 刘敏谢芳全康庄庄李强潘巍李雪陈群李战怀
- 关键词:RFID中间件数据清洗复杂事件处理
- 文献传递
- 图结构XML文档的关键字检索方法
- 2011年
- 研究了基于图结构XML文档的关键字检索方法。根据图结构XML文档的结构特点,结合用户输入的关键字及其类型,建立了用户查询语义模型;定义了拥有完整语义信息的查询结果模型,并从层次结构上分析来定义结果的语义相关性排序方案;提出基于语义的双层索引结构。实验结果表明,算法具有较高的准确率和效率。
- 李少亮陈群崔海文
- 关键词:关键字检索
- XML关键字检索中推断用户需求信息对象的方法XObject被引量:2
- 2010年
- 基于关键字查询的XML检索技术,因为它的用户友好性,近几年得到了信息检索领域研究者的广泛关注。但是由于关键字缺少XML结构语义信息,检索结果和用户需求存在较大偏差。而基于结构的XML检索,用户不仅需要了解XML内部结构,还要掌握结构查询语言,导致用户难以提出准确描述查询意图的查询表达式。文章结合二者研究方向之长,提出一种基于关键字的结构查询方法XObject。XObject用面向对象的思想,分析查询关键字和XML的结构信息,推断用户查询的信息对象,构建一组结构查询语句,再通过现有的结构检索系统,实现查询。经在多个XML实际数据集上验证,结果表明,XObject方法具有很高的查全率和查准率,尤其是和经典的关键字查询方法SLCA相比,XObject方法查准率有明显提高。
- 李霞李战怀陈群王鹏娄颖
- 关键词:XML信息检索关键字
- 基于词项扩展的XML信息检索反馈技术被引量:2
- 2011年
- 为提高XML信息检索的查询准确率,提出一种基于词项扩展的XML信息检索反馈技术。利用词项所在节点的语义权重、词项与查询词间的相邻频度、共现程度,评估词项权重并排序,取权重较大的词项对初始检索词进行扩展,给出各因子的计算方法。在Wikipedia2009数据集上的实验结果表明,扩展后的查询准确率较高。
- 温馨陈群娄颖
- 关键词:XML信息检索