河北省教育厅科研基金(2006406)
- 作品数:6 被引量:37H指数:3
- 相关作者:李凯常圣领崔丽娟陈新勇高悦更多>>
- 相关机构:河北大学河北省机器学习与计算智能重点实验室工业和信息化部更多>>
- 发文基金:河北省教育厅科研基金博士科研启动基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于Oracle选择的朴素贝叶斯集成算法被引量:1
- 2009年
- 针对朴素贝叶斯模型的稳定性,进一步提高朴素贝叶斯模型的性能,通过集成学习方法克服朴素贝叶斯模型中属性独立的限制条件,提出一种基于Oracle选择的朴素贝叶斯集成算法,使用Oracle选择机制破坏其稳定性,并从中选取较好的分类器作为集成学习中的个体成员,使用投票方法对结果进行融合。实验结果证明,该算法能提高朴素贝叶斯模型分类的正确率,表明OSBE的性能在一些数据集上优于Bagging与Adaboost集成学习的性能。
- 李凯郝丽锋
- 关键词:稳定性投票法
- 集成学习算法的差异性及性能比较被引量:23
- 2008年
- 从差异性出发,研究了基于特征集技术(通过一定的策略选取不同特征集以组成训练集)与数据技术(通过取样技术选取不同的训练集)的集成学习算法,分析了两种集成学习算法产生差异性的方法。针对决策树与神经网络模型,在标准数据集中对集成学习算法的性能进行实验研究,结果表明集成学习算法的性能依赖于数据集的特性以及产生差异性的方法等因素。从总体性能考虑,基于数据的集成学习算法在大多数数据集上优于基于特征集的集成学习算法。
- 李凯崔丽娟
- 关键词:特征集
- 基于集成学习的入侵检测方法被引量:1
- 2008年
- 入侵检测是近年来网络安全研究的热点。利用多分类器技术,研究了基于集成学习的入侵检测方法。应用Bootstrap技术生成分类器个体,为了提高分类器的差异性,应用聚类技术对分类器进行聚类,在相应的聚类结果中选取不同的分类器个体,并选择不同的融合方法对分类结果进行融合。针对入侵检测数据的实验表明了该集成技术的有效性。
- 李凯陈武
- 关键词:入侵检测泛化性能
- 基于k-means聚类的神经网络分类器集成方法研究被引量:7
- 2009年
- 针对差异性是集成学习的必要条件,研究了基于k-means聚类技术提高神经网络分类器集成差异性的方法。通过训练集并使用神经网络分类器学习算法训练许多分类器模型,在验证集中利用每个分类器的分类结果作为聚类的数据对象;然后应用k-means聚类方法对这些数据聚类,在聚类结果的每个簇中选择一个分类器代表模型,以此构成集成学习的成员;最后应用投票方法实验研究了这种提高集成学习差异性方法的性能,并与常用的集成学习方法bagging、adaboost进行了比较。
- 李凯常圣领
- 关键词:分类器聚类
- 基于聚类技术的集成学习方法研究被引量:2
- 2009年
- 研究了基于聚类技术提高分类器差异性的方法.通过Bootstrap技术与分类器学习算法训练分类器模型,利用分类器在验证集上的分类结果作为聚类的数据对象;然后应用聚类算法对这些数据聚类,并在每个簇中选择分类器代表模型,以此构成集成学习的成员;最后应用融合方法实验研究了基于聚类技术提高差异性的集成学习性能,并与集成学习方法bagging,adaboost进行了实验比较.
- 李凯常圣领高悦
- 关键词:聚类分类器
- 基于核策略的半监督学习方法被引量:3
- 2009年
- 通过扩展核一致性方法,提出基于核策略的半监督学习算法GCM,研究5种不同度量方法中参数与算法性能的关系,对使用不同度量的GCM算法的性能进行比较。实验结果表明,使用指数度量的GCM算法的性能最优,而使用欧几里得度量的GCM算法的性能最差。不同度量中的参数取值对算法的性能具有一定的影响。
- 李凯陈新勇
- 关键词:半监督学习