您的位置: 专家智库 > >

陈艳秋

作品数:1 被引量:5H指数:1
供职机构:东软信息技术学院更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇中文
  • 1篇中文文本
  • 1篇中文文本分类
  • 1篇文本分类
  • 1篇贝叶斯
  • 1篇贝叶斯算法

机构

  • 1篇大连海洋大学
  • 1篇东软信息技术...

作者

  • 1篇孙培立
  • 1篇陈艳秋

传媒

  • 1篇计算机应用与...

年份

  • 1篇2014
1 条 记 录,以下是 1-1
排序方式:
一种基于类别强信息特征和贝叶斯算法的中文文本分类器被引量:5
2014年
为了提高中文文本分类的效率与精度,设计一种新型的分类器。该分类器采用基于语料库的正向扫描统计分词。在词频统计阶段,采取训练阶段的按类别统计和测试阶段的按文章不同区域统计的方法;为了更好地选择特征词,提出了频度、集中度、相关度三个强信息特征标准;在特征权重计算上,提出了将词频和综合特征选择函数相结合的权重计算方法;最后,结合朴素贝叶斯原理进行分类。实验证明该分类器简单有效。
陈艳秋孙培立
关键词:中文文本分类
共1页<1>
聚类工具0