您的位置: 专家智库 > >

邹亚会

作品数:3 被引量:3H指数:1
供职机构:南京财经大学图书馆更多>>
相关领域:自动化与计算机技术文化科学更多>>

文献类型

  • 3篇中文期刊文章

领域

  • 2篇自动化与计算...
  • 1篇文化科学

主题

  • 3篇相似重复记录
  • 1篇大型数据
  • 1篇大型数据库
  • 1篇信息集成
  • 1篇信息集成方法
  • 1篇信息增益
  • 1篇数据库
  • 1篇自适
  • 1篇自适应
  • 1篇字符
  • 1篇字符串
  • 1篇字符串匹配
  • 1篇汉语
  • 1篇串匹配

机构

  • 3篇南京财经大学

作者

  • 3篇邹亚会
  • 1篇朱静
  • 1篇程国达

传媒

  • 1篇内蒙古科技与...
  • 1篇计算机应用
  • 1篇科技情报开发...

年份

  • 2篇2011
  • 1篇2005
3 条 记 录,以下是 1-3
排序方式:
检测大型数据库中汉语相似重复记录的方法被引量:1
2011年
提出了一种基于信息增益选择排序属性的消除汉语相似重复记录的方法。其中,记录之间的匹配方法考虑了汉语的缩写和输入错误。实验证明,该方法是有效的。
邹亚会
关键词:相似重复记录信息增益数据库汉语
一种有效检测汉语相似重复记录的方法
2011年
从排序属性的选择、匹配方法、相似度计算、检测和处理相似重复记录以及实验结果几个方面,阐述了一种有效检测汉语相似重复记录的方法。
邹亚会
关键词:相似重复记录
一种自适应信息集成方法被引量:2
2005年
检测相似重复记录是信息集成中的关键任务之一,尽管已经提出了各种检测相似重复记录的方法,但字符串匹配算法是这些检测方法中的核心。在提出的自适应信息集成算法中,用一个综合了编辑距离和标记距离的混合相似度去度量字符串之间的相似度。为了避免由于表达方式的差异而造成的字符串之间的不匹配,字符串被分割成独立的单词后按单词的第一个字符进行排序。在单词的匹配中,对拼写错误和缩写有一定的容错功能。实验结果表明,自适应信息集成方法比用Smith Waterman和Jaro距离有更高的正确率。
程国达邹亚会朱静
关键词:相似重复记录字符串匹配
共1页<1>
聚类工具0