2024年12月4日
星期三
|
欢迎来到维普•公共文化服务平台
登录
|
进入后台
[
APP下载]
[
APP下载]
扫一扫,既下载
全民阅读
职业技能
专家智库
参考咨询
您的位置:
专家智库
>
>
孟凡亮
作品数:
1
被引量:3
H指数:1
供职机构:
北京石油化工学院信息工程学院计算机系
更多>>
发文基金:
国家部委预研基金
北京市教委资助项目
更多>>
相关领域:
自动化与计算机技术
更多>>
合作作者
张国英
北京石油化工学院信息工程学院计...
沙芸
北京石油化工学院信息工程学院计...
作品列表
供职机构
相关作者
所获基金
研究领域
题名
作者
机构
关键词
文摘
任意字段
作者
题名
机构
关键词
文摘
任意字段
在结果中检索
文献类型
1篇
中文期刊文章
领域
1篇
自动化与计算...
主题
1篇
娱乐
1篇
去重
1篇
去重算法
1篇
文档
1篇
文档相似度
1篇
相似度
1篇
新词识别
1篇
关键词提取
机构
1篇
北京石油化工...
作者
1篇
沙芸
1篇
张国英
1篇
孟凡亮
传媒
1篇
广西师范大学...
年份
1篇
2007
共
1
条 记 录,以下是 1-1
全选
清除
导出
排序方式:
相关度排序
被引量排序
时效排序
基于关键词提取的娱乐新闻文档去重算法
被引量:3
2007年
去除内容相同或相近的新闻是提高搜索引擎的关键技术之一。提出一种基于关键词提取的新闻去重算法,通过以标题为种子点构建词汇链的方法,能够找到对主题贡献大的非高频词,从而抽取出完整文档关键词集合,该方法能够基于小规模语料库识别新词;为了提高网页去重速度和质量,基于关键词建立去重倒排文档。实验结果显示,该方法与传统方法相比排斥错误率降低了5%,去重时间缩短了20%-30%。
沙芸
张国英
孟凡亮
关键词:
关键词提取
新词识别
文档相似度
全选
清除
导出
共1页
<
1
>
聚类工具
0
执行
隐藏
清空
用户登录
用户反馈
标题:
*标题长度不超过50
邮箱:
*
反馈意见:
反馈意见字数长度不超过255
验证码:
看不清楚?点击换一张