您的位置: 专家智库 > >

张延祥

作品数:1 被引量:7H指数:1
供职机构:北京航空航天大学软件学院更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇文本分类

机构

  • 1篇北京航空航天...

作者

  • 1篇潘海侠
  • 1篇张延祥

传媒

  • 1篇中文信息学报

年份

  • 1篇2015
1 条 记 录,以下是 1-1
排序方式:
一种基于区分能力的多类不平衡文本分类特征选择方法被引量:7
2015年
文本分类中的不平衡数据问题在现实应用中比较普遍。传统的特征选择方法在不平衡问题上倾向于多数类而忽略稀有类。针对这种倾向性该文提出了一种主导性分析量化方法,并基于对该方法的优化提出了一种基于类别区分能力的特征选择方法,即DA(Discriminative Ability)方法,该方法使用文档概率的最小绝对值差作为评分标准,一定程度上保证了特征选择在稀有类与多数类上的公平性。实验表明,DA优于CHI、IG、DFICF,尤其在F1宏平均指标上,DA在不平衡问题上能够取得更好的降维效果。
张延祥潘海侠
关键词:文本分类
共1页<1>
聚类工具0