2024年11月25日
星期一
|
欢迎来到维普•公共文化服务平台
登录
|
进入后台
[
APP下载]
[
APP下载]
扫一扫,既下载
全民阅读
职业技能
专家智库
参考咨询
您的位置:
专家智库
>
>
王建华
作品数:
1
被引量:55
H指数:1
供职机构:
北京理工大学信息科学技术学院计算机科学工程系
更多>>
相关领域:
自动化与计算机技术
更多>>
合作作者
顾益军
北京理工大学信息科学技术学院计...
黄维金
中国人民公安大学
樊孝忠
北京理工大学信息科学技术学院计...
汪涛
北京理工大学信息科学技术学院计...
作品列表
供职机构
相关作者
所获基金
研究领域
题名
作者
机构
关键词
文摘
任意字段
作者
题名
机构
关键词
文摘
任意字段
在结果中检索
文献类型
1篇
中文期刊文章
领域
1篇
自动化与计算...
主题
1篇
停用词
1篇
中文
1篇
联合熵
机构
1篇
北京理工大学
1篇
中国人民公安...
作者
1篇
汪涛
1篇
樊孝忠
1篇
黄维金
1篇
顾益军
1篇
王建华
传媒
1篇
北京理工大学...
年份
1篇
2005
共
1
条 记 录,以下是 1-1
全选
清除
导出
排序方式:
相关度排序
被引量排序
时效排序
中文停用词表的自动选取
被引量:55
2005年
通过对现有基于统计的停用词选取方法的考察,提出了一种新的停用词选取方法.用该方法分别计算词条在语料库中各个句子内发生的概率和包含该词条的句子在语料库中的概率,在此基础上计算它们的联合熵,依据联合熵选取停用词.将该方法与传统方法选取的停用词表进行了对比,并比较了将各种方法用于文本分类的预处理时对分类效果的影响.实验结果表明,该方法更好地避免了语料的行文格式对停用词选取的影响,比传统方法更适用于文本分类的预处理.
顾益军
樊孝忠
王建华
汪涛
黄维金
关键词:
停用词
联合熵
全选
清除
导出
共1页
<
1
>
聚类工具
0
执行
隐藏
清空
用户登录
用户反馈
标题:
*标题长度不超过50
邮箱:
*
反馈意见:
反馈意见字数长度不超过255
验证码:
看不清楚?点击换一张