李明方
- 作品数:4 被引量:15H指数:2
- 供职机构:山东师范大学更多>>
- 发文基金:山东省教育厅科技计划山东省自然科学基金山东省科技攻关计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 决策树构建方法:向前两步优于一步被引量:1
- 2010年
- 为提高搜索算法找到全局最优解的可能性,在C4.5算法的基础上,本文提出了向前两步的决策树(two-step forward decision tree,TSFDT)构建算法。该算法在选择属性时,考虑同时选择两个属性带来的信息增益,而不是只考虑单一最优属性对于信息增益的贡献,从而在寻找问题全局最优方面比只考虑单一最优属性具有更大的可能性。10个UCI基准数据集上的实验结果表明,该算法明显优于C4.5算法。
- 张雯张化祥李明方计华
- 关键词:决策树信息增益C4.5算法
- 针对不平衡数据集的Bagging改进算法被引量:12
- 2010年
- 传统的Bagging分类方法对不平衡数据集进行分类时,虽然能够达到很高的分类精度,但是对其中少数类的分类准确率不高。为提高其对少数类数据的分类精度,利用SMOTE算法对样例集中的少数类样例进行加工,在Bagging算法中根据类值对各个样例的权重进行调整。混淆矩阵和ROC曲线表明改进算法达到了既能保证整体的分类准确率,又能提高少数类分类精度的目的。
- 李明方张化祥
- 关键词:BAGGING算法
- 不平衡数据集的神经网络阈值优化方法被引量:2
- 2010年
- 不平衡数据集分类为机器学习热点研究问题之一,近年来研究人员提出很多理论和算法以改进传统分类技术在不平衡数据集上的性能,其中用阈值判定标准确定神经网络中的阈值是重要的方法之一。常用的阈值判定标准存在一定缺点,如不能使少数类及多数类分类精度同时取得最好、过于偏好多数类的精度等。为此提出一种新的阈值判定标准,依据该标准能够使少数类及多数类分类精度同时取得最好而不受样例类别比例的影响。以神经网络与遗传算法相结合训练分类器,作为阈值选择条件和分类器的评价标准,新标准能够得到较好的结果。
- 李明方张化祥张雯计华
- 关键词:不平衡数据集神经网络遗传算法
- 少数类数据识别方法及性能评价
- 分类算法是当今机器学习领域中重要的研究方向之一,很多经典算法在实际问题中得到广泛的应用并取得了良好的效果。传统的分类算法假设数据分布均衡,并且以提高分类算法对数据集的整体分类正确率为主要目标。但现实中很多数据集中的不同类...
- 李明方
- 关键词:数据识别性能评价特征提取