黑龙江省普通高等学校新世纪优秀人才培养计划(1155-ncet-008)
- 作品数:7 被引量:31H指数:4
- 相关作者:孙广路何勇军刘帅苏洁李丹丹更多>>
- 相关机构:哈尔滨理工大学北京宇航系统工程研究所更多>>
- 发文基金:黑龙江省普通高等学校新世纪优秀人才培养计划黑龙江省教育科学规划课题黑龙江省自然科学基金更多>>
- 相关领域:电气工程自动化与计算机技术更多>>
- 特征选择方法中三种度量的比较研究被引量:9
- 2018年
- 不同类型数据中特征与类别以及特征与特征之间存在一定的线性和非线性相关性。针对基于不同度量的特征选择方法在不同类型数据集上选取的特征存在明显差别的问题,本文选择线性相关系数、对称不确定性和互信息三种常用的线性或非线性度量,将它们应用于基于相关性的快速特征选择方法中,对它们在基因微阵列和图像数据上的特征选择效果进行实验验证和比较。实验结果表明,基于相关性的快速特征选择方法使用线性相关系数在基因数据集上选取的特征集往往具有较好分类准确率,使用互信息在图像数据集上选取的特征集的分类效果较好,使用对称不确定性在两种类型数据上选取特征的分类效果较为稳定。
- 宋智超康健孙广路何勇军
- 关键词:线性相关系数互信息
- 基于Dempster-Shafer理论的GHSOM入侵检测方法被引量:5
- 2015年
- 结合证据推理DS理论,提出了基于Dempster-Shafer理论的GHSOM神经网络入侵检测方法,一方面处理数据不确定性中的随机性和模糊性问题,可以在噪音环境下保持良好的检测率,此外通过证据融合理论缩小数据集,有效控制网络的动态增长。实验结果表明,基于Dempster-Shafer理论的GHSOM入侵检测方法实现了对子网拓展规模在检测中的动态控制,提升了在网络规模不断扩展时的动态适应性,在噪音环境下具有良好的检测准确率,提升了GHSOM入侵检测方法的扩展性。
- 苏洁董伟伟许璇刘帅谢立鹏
- 关键词:DEMPSTER-SHAFER理论入侵检测网络安全
- 基于信息损失量估计的匿名图构造方法被引量:5
- 2016年
- 首先分析了在进化的社会网络序列中,攻击者利用节点度信息,通过识别目标节点的方法对局部社会网络进行攻击过程,分析了利用k匿名方法对该类攻击进行隐私保护时存在的信息损失问题,针对该问题,提出了一种基于信息损失量估计的k匿名图流构造方法,通过子图节点属性泛化、子图内部结构的泛化控制图重构的信息损失,通过禁止子图内部扰动阻止网络攻击。定义匿名过程中由于图重构造成的节点和结构信息损失的估算方法,建立了基于贪婪聚类算法的网络节点的k匿名聚类算法,根据信息损失估计实现匿名分组,在进化的社会网络中以最小信息损失量构造匿名社会网络,在医疗诊断数据集上的实验表明所提方法能够较理想地控制信息损失量。
- 苏洁刘帅罗智勇孙广路
- 关键词:社会网络隐私保护
- 实时网络流特征提取系统设计被引量:3
- 2017年
- 针对包采样技术在高速网络环境中提取流特征准确率低的问题,利用NetFPGA运行速度快,并行处理能力强的优势,实现了一个实时网络流特征提取系统,使其支持千兆级数据吞吐率。该系统有两个重要模块:地址映射模块和流表核心处理模块,前者将Bob Jenkins哈希算法通过流水线方式设计,实现流记录的快速索引;后者通过对流记录的并行查询与匹配,实现对流表的快速更新。对该系统进行在线流量测试,结果表明其能够在1Gbps网络中实现对网络流特征的实时提取。
- 陈涛乔佩利孙广路朱素霞
- 关键词:NETFPGABOB
- 基于子空间聚类的网络流量分类方法被引量:3
- 2015年
- 应用层网络流量分类技术对流量控制与管理等研究具有重要意义.针对传统的基于有监督机器学习的分类方法对所有应用程序使用相同的特征,使得某些特征对一种或几种应用类型有区分性,而对其他应用类型的网络流分类产生干扰等问题,提出基于子空间聚类方法的网络流分类框架.利用子空间聚类算法,在总特征集中为每一种类型应用进行特征选择,提取与之相对应的关键特征,自动消除不相关的特征,使得每种应用类型都产生对应的特征签名集,并用这些不同的特征签名对未知的网络流进行分类.实验结果表明:本文提出的方法能够有效地提出每种应用类型的特征签名,并且所提出的特征签名具有明显的可区分性,该方法的分类准确率在93%以上,并且能很好的识别新出现的应用.
- 李丹丹田春伟李佰洋孙广路康健
- 关键词:子空间聚类
- 基于朴素贝叶斯模型的邮件过滤技术被引量:6
- 2014年
- 针对朴素贝叶斯算法应用于反垃圾邮件过滤时,其有效性十分依赖于对邮件内容的有效建模,而邮件内容建模方面研究尚不成熟限制了贝叶斯方法在垃圾邮件过滤中的性能.采用了三种概率分布对邮件内容进行建模,据此提出了3种概率分布下的朴素贝叶斯算法.为了提高训练效率,算法采用了一种增量式的垃圾邮件过滤方法.在trec05p-1、trec06p两个公开数据集上对这3种贝叶斯算法进行了实验对比,分析出三种贝叶斯分布的适用范围.从不同分布的邮件内容建模角度出发,为过滤垃圾邮件的方法选择提供了有效依据.
- 杨赫孙广路何勇军
- 关键词:邮件过滤朴素贝叶斯
- 基于链路同质性的应用层流量分类方法被引量:1
- 2013年
- 随着高速网络链路中数据量的剧增,以及越来越多的流行应用使用动态端口或使用加密流量通信,导致传统的网络流量分类方法失效.本文研究了应用层流量中存在的链路同质性,结合统计关联学习方法和流量传播图挖掘方法,提出了一种基于链路同质性的应用层流量分类方法.我们分析数据集中邻接链路之间的统计依赖关系并应用于网络协议识别,而不依赖于数据包载荷与网络流特征.实验结果表明,本文提出的方法能够实现超过80%的流量识别精度.
- 董辉孙广路李丹丹肖锋
- 关键词:应用层流量