2024年11月30日
星期六
|
欢迎来到维普•公共文化服务平台
登录
|
进入后台
[
APP下载]
[
APP下载]
扫一扫,既下载
全民阅读
职业技能
专家智库
参考咨询
您的位置:
专家智库
>
>
熊大康
作品数:
2
被引量:3
H指数:1
供职机构:
安徽大学
更多>>
相关领域:
自动化与计算机技术
更多>>
合作作者
刘倩倩
安徽大学计算机科学与技术学院
郑诚
安徽大学计算机科学与技术学院
作品列表
供职机构
相关作者
所获基金
研究领域
题名
作者
机构
关键词
文摘
任意字段
作者
题名
机构
关键词
文摘
任意字段
在结果中检索
文献类型
1篇
期刊文章
1篇
学位论文
领域
2篇
自动化与计算...
主题
2篇
主题模型
2篇
文本分类
1篇
特征提取
1篇
文本挖掘
1篇
向量
1篇
向量化
机构
2篇
安徽大学
作者
2篇
熊大康
1篇
郑诚
1篇
刘倩倩
传媒
1篇
电脑知识与技...
年份
2篇
2014
共
2
条 记 录,以下是 1-2
全选
清除
导出
排序方式:
相关度排序
被引量排序
时效排序
基于卡方特征选择和LDA主题模型的中文短文本分类
被引量:3
2014年
中文短文本自身包含词汇个数少、描述信息能力弱,常用的文本分类方法对于短文本分类效果不理想。同时传统的文本分类方法在处理大规模文本分类时会出现向量维数很高的情况,造成算法效率低,而且一般用于长文本分类的特征选择方法都是基于数理统计的,忽略了文本中词项之间的语义关系。针对以上问题本文提出基于卡方特征选择和LDA主题模型的中文短文本分类方法,方法使用LDA主题模型的训练结果对传统特征选择方法进行特征扩展,以达到将数理信息和语义信息融入分类算法的目的。对比试验表明,这种方法提高了中文短文本分类效果。
郑诚
熊大康
刘倩倩
关键词:
主题模型
中文短文本分类技术的研究与实现
文本分类是文本挖掘领域的一门重要学科,是指在已知的分类体系中,根据已知文本内容自动确定未知文本类别的过程,文本分类在一定程度上帮助用户处理获得的杂乱信息,有助于用户根据自己的倾向有选择地阅读海量的文本。目前多数情况下,文...
熊大康
关键词:
文本挖掘
主题模型
特征提取
全选
清除
导出
共1页
<
1
>
聚类工具
0
执行
隐藏
清空
用户登录
用户反馈
标题:
*标题长度不超过50
邮箱:
*
反馈意见:
反馈意见字数长度不超过255
验证码:
看不清楚?点击换一张