2024年12月18日
星期三
|
欢迎来到维普•公共文化服务平台
登录
|
进入后台
[
APP下载]
[
APP下载]
扫一扫,既下载
全民阅读
职业技能
专家智库
参考咨询
您的位置:
专家智库
>
>
邹亚会
作品数:
3
被引量:3
H指数:1
供职机构:
南京财经大学图书馆
更多>>
相关领域:
自动化与计算机技术
文化科学
更多>>
合作作者
程国达
南京财经大学信息工程学院
朱静
南京财经大学信息工程学院
作品列表
供职机构
相关作者
所获基金
研究领域
题名
作者
机构
关键词
文摘
任意字段
作者
题名
机构
关键词
文摘
任意字段
在结果中检索
文献类型
3篇
中文期刊文章
领域
2篇
自动化与计算...
1篇
文化科学
主题
3篇
相似重复记录
1篇
大型数据
1篇
大型数据库
1篇
信息集成
1篇
信息集成方法
1篇
信息增益
1篇
数据库
1篇
自适
1篇
自适应
1篇
字符
1篇
字符串
1篇
字符串匹配
1篇
汉语
1篇
串匹配
机构
3篇
南京财经大学
作者
3篇
邹亚会
1篇
朱静
1篇
程国达
传媒
1篇
内蒙古科技与...
1篇
计算机应用
1篇
科技情报开发...
年份
2篇
2011
1篇
2005
共
3
条 记 录,以下是 1-3
全选
清除
导出
排序方式:
相关度排序
被引量排序
时效排序
检测大型数据库中汉语相似重复记录的方法
被引量:1
2011年
提出了一种基于信息增益选择排序属性的消除汉语相似重复记录的方法。其中,记录之间的匹配方法考虑了汉语的缩写和输入错误。实验证明,该方法是有效的。
邹亚会
关键词:
相似重复记录
信息增益
数据库
汉语
一种有效检测汉语相似重复记录的方法
2011年
从排序属性的选择、匹配方法、相似度计算、检测和处理相似重复记录以及实验结果几个方面,阐述了一种有效检测汉语相似重复记录的方法。
邹亚会
关键词:
相似重复记录
一种自适应信息集成方法
被引量:2
2005年
检测相似重复记录是信息集成中的关键任务之一,尽管已经提出了各种检测相似重复记录的方法,但字符串匹配算法是这些检测方法中的核心。在提出的自适应信息集成算法中,用一个综合了编辑距离和标记距离的混合相似度去度量字符串之间的相似度。为了避免由于表达方式的差异而造成的字符串之间的不匹配,字符串被分割成独立的单词后按单词的第一个字符进行排序。在单词的匹配中,对拼写错误和缩写有一定的容错功能。实验结果表明,自适应信息集成方法比用Smith Waterman和Jaro距离有更高的正确率。
程国达
邹亚会
朱静
关键词:
相似重复记录
字符串匹配
全选
清除
导出
共1页
<
1
>
聚类工具
0
执行
隐藏
清空
用户登录
用户反馈
标题:
*标题长度不超过50
邮箱:
*
反馈意见:
反馈意见字数长度不超过255
验证码:
看不清楚?点击换一张