黄晖
- 作品数:3 被引量:8H指数:1
- 供职机构:河南工业大学理学院更多>>
- 发文基金:河南省科技攻关计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于自助平均的朴素贝叶斯文本分类器被引量:6
- 2007年
- 针对单词簇上训练朴素贝叶斯文本分类器概率估计偏差较大所导致的分类精度较低问题,在概率分布聚类算法得到的单词簇的基础上,根据单词与簇间互信息建立有序单词子序列,采用有放回随机抽样对序列构造规模相当的样本集,并将估计出的参数的平均值作为训练得到的参数对未知文本进行分类。公共文本实验数据集上的实验结果表明,该文提出的训练方法相对于传统的朴素贝叶斯分类器训练方法能够获得更高的分类精度且过程相对简单。
- 白莉媛黄晖刘素华阎秋玲
- 关键词:文本分类朴素贝叶斯分类器
- 基于Bootstrap Averaging的贝叶斯分类算法被引量:1
- 2007年
- 针对单词簇上训练朴素贝叶斯文本分类器概率估计偏差较大所导致的分类精度较低问题。在使用概率分布聚类算法得到的单词簇的基础上,根据单词与簇间互信息建立有序单词子序列,采用有放回随机抽样对单词序列构造规模相当的样本集并将估计出的参数的平均值作为训练得到的最终参数对未知文本进行分类。公共文本实验数据集上的实验结果表明,提出的训练方法相对于传统的朴素贝叶斯分类器训练方法能够获得更高的分类精度且过程相对简单。
- 白莉媛肖乐黄晖丁伟
- 关键词:文本分类朴素贝叶斯分类器
- 基于变异的迭代k-means算法被引量:1
- 2007年
- 针对k-means聚类算法效率底、优化不足等问题,提出了一种基于变异的迭代k-means算法(ik-means)。该算法从k-means算法(随机k-means算法)所产生的初始解向量中随机选取一定比例的位置,对其中的类标号进行随机变异并优化;再通过多次迭代获得了相应的优化解。实验表明在数据集相同、基本k-means算法调用次数相同的条件下,ik-means算法相对于k-means算法具有运行效率高、解更优化的特点。
- 白莉媛黄晖孙增华
- 关键词:聚类K-MEANS算法