您的位置: 专家智库 > >

孙伟娟

作品数:2 被引量:1H指数:1
供职机构:北京交通大学计算机与信息技术学院更多>>
发文基金:国家自然科学基金中央高校基本科研业务费专项资金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 2篇自动化与计算...

主题

  • 2篇一致性
  • 2篇网络
  • 1篇映射
  • 1篇数据集
  • 1篇数据集成
  • 1篇匹配度
  • 1篇重合度
  • 1篇TOP-K

机构

  • 2篇北京交通大学

作者

  • 2篇王宁
  • 2篇孙伟娟
  • 1篇齐飞

传媒

  • 1篇计算机工程
  • 1篇计算机科学

年份

  • 1篇2019
  • 1篇2017
2 条 记 录,以下是 1-2
排序方式:
基于一致性支持度的实体top-k扩展算法被引量:1
2019年
现有的实体扩展技术返回单一结果,且只适用于扩展单个属性列,对于多属性列的实体扩展易产生实体不一致的问题。为此,提出2种实体top-k扩展算法。根据答案表之间的一致性匹配度,在众多网络表格中找到k个具有最高一致性支持度的答案表集合,以补充待扩展实体的缺失信息。实验结果表明,2种算法能够较好地实现实体的top-k扩展,并保持扩展结果的高一致性和高准确度。基于一致性匹配度的实体top-k扩展算法具有较高的多样性,而基于分支限界的实体top-k扩展算法在可信度方面有更好的表现。
孙伟娟王宁
关键词:数据集成
基于列重合度的网络表格一致性扩展
2017年
网络表格的扩展是根据已知信息扩展与主列相关的其他属性列,以满足人们通过表格获取感兴趣信息的需求。目前的研究工作主要针对由主列和待扩展列组成的实体-属性二元表,并将主列视为其他属性列扩展的唯一依据,但该技术运用到具有多个待扩展列的网络表格时,由多个二元表拼接而成的结果表很容易出现实体不一致现象。综合考虑各属性列间以及元组行间的关系,提出一致性支持度概念,设计并实现了基于列重合度的表格一致性扩展系统CCA,其既能保证候选值的高匹配分数,又能使结果表中填值所使用的数据源表数目最小化,有效地避免了实体不一致问题。实验表明,与现有方法相比CCA系统有更高的精确度、覆盖率、一致性,以及更低的查询时间代价。
齐飞王宁张丽方孙伟娟
共1页<1>
聚类工具0