2024年12月24日
星期二
|
欢迎来到维普•公共文化服务平台
登录
|
进入后台
[
APP下载]
[
APP下载]
扫一扫,既下载
全民阅读
职业技能
专家智库
参考咨询
您的位置:
专家智库
>
>
曹海
作品数:
1
被引量:4
H指数:1
供职机构:
复旦大学计算机科学技术学院上海市数据科学重点实验室
更多>>
发文基金:
上海市科学技术委员会资助项目
国家科技支撑计划
更多>>
相关领域:
自动化与计算机技术
更多>>
合作作者
孙婧
复旦大学计算机科学技术学院上海...
史喜斌
复旦大学计算机科学技术学院上海...
作品列表
供职机构
相关作者
所获基金
研究领域
题名
作者
机构
关键词
文摘
任意字段
作者
题名
机构
关键词
文摘
任意字段
在结果中检索
文献类型
1篇
中文期刊文章
领域
1篇
自动化与计算...
主题
1篇
迭代
1篇
短文
1篇
去重
1篇
去重算法
1篇
最近邻
1篇
共享最近邻
1篇
SIM
1篇
HASH算法
机构
1篇
复旦大学
作者
1篇
史喜斌
1篇
曹海
1篇
孙婧
传媒
1篇
计算机工程
年份
1篇
2015
共
1
条 记 录,以下是 1-1
全选
清除
导出
排序方式:
相关度排序
被引量排序
时效排序
基于特征迭代的短文本去重算法
被引量:4
2015年
由于短文本具有词频单一、结构简单等特点,基于传统特征选取方法的文本去重算法不适合短文本。为此,提出一种适合短文本特点的去重算法,利用SimHash算法产生短文本的指纹,使用共享最近邻算法对指纹进行聚类,根据聚类结果增删初始特征,迭代直至收敛,从而实现短文本的去重检测。在真实数据集上的实验结果表明,与现有的文本去重算法相比,该算法对于短文本具有更好的去重效果。
曹海
孙婧
史喜斌
关键词:
共享最近邻
迭代
去重
全选
清除
导出
共1页
<
1
>
聚类工具
0
执行
隐藏
清空
用户登录
用户反馈
标题:
*标题长度不超过50
邮箱:
*
反馈意见:
反馈意见字数长度不超过255
验证码:
看不清楚?点击换一张