山东省高等学校科技计划项目(J11LG05) 作品数:13 被引量:50 H指数:3 相关作者: 江峰 杜军威 刘国柱 眭跃飞 张友强 更多>> 相关机构: 青岛科技大学 中国科学院 九江职业技术学院 更多>> 发文基金: 山东省高等学校科技计划项目 国家自然科学基金 山东省自然科学基金 更多>> 相关领域: 自动化与计算机技术 更多>>
基于近似约简的集成学习算法及其在入侵检测中的应用 被引量:1 2016年 为了获得较大差异性的基学习器来构建集成学习器,从属性空间划分的角度来考虑集成学习问题,通过粗糙集理论定义了近似约简的概念,进一步提出了基于近似约简的集成学习算法;本方法将数据集的属性空间划分为多个子空间,基于不同子空间对应的数据集训练得到的基学习器具有较大的差异性,从而保证了集成学习器具有较强的泛化性能.为了验证本算法的有效性,本算法被应用于网络入侵检测中.在KDD CUP 99数据集上的实验表明,与传统的集成学习算法相比,本文所提出的算法具有更高的检测率和更低的计算开销,更适合于从海量高维的网络数据中检测入侵. 江峰 张友强 杜军威 刘国柱 眭跃飞关键词:近似约简 入侵检测 K-modes聚类初始类中心选择算法研究 被引量:2 2015年 针对现有的K-modes聚类初始类中心选择方法所存在的问题,本文提出一种基于加权密度的初始类中心选择算法。在该算法中,我们通过计算对象的加权密度来选择初始类中心,而在计算对象的加权密度时,不同的属性将根据其重要性被赋予不同的权重,从而可以有效地体现出不同属性之间的差异。 张佃伦 江峰关键词:聚类 粗糙集 一种基于抽样与约简的集成学习算法 被引量:2 2016年 集成学习的一个重要目标是获得一组差异性大的基分类器来构建集成分类器。为实现这一目标,提出一种基于抽样与约简的集成学习算法ELSR。该算法采用多模态扰动策略来训练基分类器。首先,采用多次抽样策略从训练集中抽样产生k个抽样集;其次,使用粗糙集的属性约简技术对每个抽样集进行约简;第三,在每一个约简之后的抽样集上分别训练一个基分类器;最后,利用一个验证集对每个基分类器进行性能测试,并根据测试结果选择一组合适的基分类器来构建集成分类器。在UCI数据集上的实验表明:当采用KNN算法或者C4.5算法来训练基分类器时,ELSR的分类性能总是要优于现有的集成学习算法。 江峰 张友强 杜军威 刘国柱 冯云霞关键词:属性约简 粗糙集 基于k-modes聚类的不平衡数据混合采样方法 被引量:1 2017年 针对现有的不平衡数据处理方法存在不能有效处理分类型数据、盲目采样及抗噪声能力差等问题,提出一种基于k-modes聚类的不平衡数据混合采样算法HS_WODKM;首先提出一种基于加权重叠距离的k-modes聚类算法WODKM,然后采用改进的合成少数过采样技术(SMOTE)算法与WODKM分别对不平衡数据进行过采样与降采样处理,从而获得一种新的不平衡数据混合采样算法HS_WODKM;HS_WODKM采用增加正类样本并减少负类样本的混合采样策略解决样本类别不平衡问题,用来处理分类型数据,并且能够克服现有方法存在的抗噪能力差、删除重要样本等缺陷;为了验证HS_WODKM的性能,在多个分类型UCI数据集上进行实验。结果表明,采用HS_WODKM算法处理分类型不平衡数据是可行且有效的。 张艳 江峰 杜军威 刘国柱 眭跃飞关键词:不平衡数据 分类型数据 过采样技术 混合采样 一种基于重构相容决策表的属性约简算法 被引量:2 2012年 基于正区域的属性约简是目前最常用的一类约简算法。现实中的决策表有可能存在不一致的对象。另外,在约简过程中随着属性个数的减少,也有可能产生新的不一致对象。对于基于正区域的约简算法来说,不一致的对象并没有提供任何有用的信息,删除不一致的对象不会改变正区域的计算结果以及最终的约简结果,而且可以显著提高算法的效率。然而现有的基于正区域的约简算法并没有考虑到这个问题,它们采用论域中的所有对象来计算正区域并得出约简结果。针对这一问题,定义了重构相容决策表和重构相容决策子表的概念。引入这两个概念的目的是在约简过程中删除初始决策表中的不一致对象,从而获得一个相容决策表。借助于这两个概念,提出了一种新的基于正区域的属性约简算法。在真实数据集上的实验表明,与传统的算法相比,该算法能够获得较小的约简结果和较高的分类精度,并且具有相对较低的时间复杂度。 赵洪波 江峰 曾惠芬关键词:粗糙集 正区域 属性约简 不相容决策表 基于相对决策熵与加权相似性的粗糙集数据补齐方法 被引量:5 2014年 现有的基于粗糙集的数据补齐方法在计算任意两个对象之间的相似性时并没有考虑不同条件属性之间的差异性。针对这一问题,引入一种新的加权相似性的概念,并提出一种基于相对决策熵与加权相似性的粗糙集数据补齐算法RDNAWS。RDNAWS算法采用相对决策熵的概念来度量每个条件属性的重要性,并通过计算每个条件属性的重要性以及决策属性集对其的依赖性来为每个条件属性提供一个权值,从而将不同的条件属性有效地区分开来。在真实数据集上的实验表明,与现有的算法相比,所提算法能够获得更好的分类性能。 王莎莎 江峰 王文鹏关键词:不完备数据 粗糙集 数据补齐 基于依赖决策熵的决策树分类算法 被引量:2 2016年 针对传统的基于信息熵的决策树算法所存在的问题,本研究从粗糙集理论的角度来考虑信息熵,定义了依赖决策熵的概念,并提出一种基于依赖决策熵的决策树算法DTDDE。在DTDDE算法中,采用依赖决策熵的概念来度量每个条件属性的重要性,并选择重要性最大的属性作为当前的分离属性。通过在多个UCI数据集上的实验表明:与现有的决策树算法相比,本研究所提出的算法能够获得更好的分类性能。 王希玲 江峰 张友强 刘国柱关键词:决策树 信息熵 粗糙集 基于加权的K-modes聚类初始中心选择算法 被引量:1 2016年 针对现有的K-modes聚类初始化方法没有考虑不同的属性具有不同的重要性这一问题,提出一种基于加权密度与加权重叠距离的初始中心选择算法Ini-Weight。Ini-Weight算法通过计算每个对象的密度以及对象之间的距离来选择初始中心。在计算对象的密度以及对象的距离时,Ini-Weight算法根据每个属性的重要性为不同的属性赋予不同的权值。最后,在UCI数据集上将Ini-Weight与现有的方法进行了比较,结果表明,Ini-Weight算法可以有效地区分不同的属性,而且提高了初始中心选择的准确性。 江峰 杜军威 刘国柱 眭跃飞关键词:粗糙集 基于图形转换的组合状态安全性验证技术 2014年 受制于系统状态组合爆炸,并发系统的组合状态验证一直是困扰模型检验的难题。基于图形转换的组合框架,研究了该框架的组合状态安全性验证技术。采用Petri网模型构造系统组合框架,分析出组合系统可达状态空间与部件可达状态空间的包含关联关系,提出了组合状态危害等级分类模型,设计出组合状态可达性分析方法和层次化多级安全性验证算法,并实例应用于轨道交通列车控制系统的功能安全性验证。 杜军威 江峰 张会萍 曹玲 殷文文关键词:PETRI网 安全苛求系统 基于随机贪心选择的选择性集成算法 2017年 针对现有的基于贪心选择的选择性集成算法易过早陷入局部最优的问题,提出一种基于随机贪心选择的选择性集成算法(SERGS);该算法引入了随机化策略来扩展贪心搜索的搜索空间,从而降低了算法陷入局部最优的可能性,并且算法的计算性能也得到了改善。在UCI数据集上的实验表明,与现有的集成学习算法和选择性集成算法相比,SERGS的分类精度高于其他算法,且建模时间少于同类型的算法。 江峰 张友强 杜军威 刘国柱 眭跃飞