孙伟娟
- 作品数:2 被引量:1H指数:1
- 供职机构:北京交通大学计算机与信息技术学院更多>>
- 发文基金:国家自然科学基金中央高校基本科研业务费专项资金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于一致性支持度的实体top-k扩展算法被引量:1
- 2019年
- 现有的实体扩展技术返回单一结果,且只适用于扩展单个属性列,对于多属性列的实体扩展易产生实体不一致的问题。为此,提出2种实体top-k扩展算法。根据答案表之间的一致性匹配度,在众多网络表格中找到k个具有最高一致性支持度的答案表集合,以补充待扩展实体的缺失信息。实验结果表明,2种算法能够较好地实现实体的top-k扩展,并保持扩展结果的高一致性和高准确度。基于一致性匹配度的实体top-k扩展算法具有较高的多样性,而基于分支限界的实体top-k扩展算法在可信度方面有更好的表现。
- 孙伟娟王宁
- 关键词:数据集成
- 基于列重合度的网络表格一致性扩展
- 2017年
- 网络表格的扩展是根据已知信息扩展与主列相关的其他属性列,以满足人们通过表格获取感兴趣信息的需求。目前的研究工作主要针对由主列和待扩展列组成的实体-属性二元表,并将主列视为其他属性列扩展的唯一依据,但该技术运用到具有多个待扩展列的网络表格时,由多个二元表拼接而成的结果表很容易出现实体不一致现象。综合考虑各属性列间以及元组行间的关系,提出一致性支持度概念,设计并实现了基于列重合度的表格一致性扩展系统CCA,其既能保证候选值的高匹配分数,又能使结果表中填值所使用的数据源表数目最小化,有效地避免了实体不一致问题。实验表明,与现有方法相比CCA系统有更高的精确度、覆盖率、一致性,以及更低的查询时间代价。
- 齐飞王宁张丽方孙伟娟