王汉萍
- 作品数:3 被引量:22H指数:2
- 供职机构:中国海洋大学更多>>
- 发文基金:山东省自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于粗糙集的文本自动分类方法的研究被引量:13
- 2003年
- 提出一种利用粗糙集理论生成文本分类规则的方法 ,通过将文本关键词的权值进行离散化处理后 ,作为规则的条件属性 ,文本所属的类别用作决策属性 ,构造决策表。然后通过属性约简和规则化简提取出文本的分类规则。该方法生成的规则易于理解 ,分类准确度较高 ,分类速度快。
- 王汉萍孟庆春张继军李占斌殷波
- 关键词:粗糙集决策表属性约简文本数据库
- 一种基于粗糙集的文本分类规则抽取方法被引量:8
- 2003年
- 随着文本数据库的日益增大 ,寻找新的文本数据处理方法变得十分紧迫。本文将粗糙集理论应用于文本自动分类的规则提取 ,提出了基于粗糙集理论的文本分类方法。把文本特征项的权值进行离散化处理后 ,作为规则的条件属性 ,文本所属的类别用作决策属性 ,构造决策表 ,然后通过决策表的知识约简算法提取出文本的分类规则。实验结果表明 ,该方法提取规则的分类正确率较高 。
- 孟庆春王汉萍魏天滨葛艳高云
- 关键词:粗糙集文本分类规则抽取决策表万维网
- 粗糙集理论在文本挖掘的分类算法中的应用研究
- 该论文主要探讨了文本自动分类的算法,所作的主要工作如下:1.描述了文本的向量空间模型,并进行了常用文本分类算法的性能分析;2.重点研究了如何利用粗糙集的知识约简理论提取文本分类规则的新方法,该方法可以自动提取分类规则,比...
- 王汉萍
- 关键词:文本挖掘文本分类粗糙集支持向量机K近邻
- 文献传递