李华
- 作品数:5 被引量:33H指数:4
- 供职机构:石家庄铁道大学数理系更多>>
- 发文基金:山西省回国留学人员科研经费资助项目国家自然科学基金山西省自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于数据流的网络入侵实时检测框架被引量:13
- 2015年
- 针对计算机网络访问请求具有实时到达以及动态变化的特点,为了实时检测网络入侵,并且适应网络访问数据的动态变化,提出一个基于数据流的网络入侵实时检测框架。首先,将误用检测模式与异常检测模式相结合,通过初始聚类建立由正常模式和异常模式构成的知识库;其次,采用数据点与数据簇之间的不相似性来度量网络访问数据与正常模式和异常模式的相似性,从而判定网络访问数据的合法性;最后,当网络访问数据流发生演化时,通过重新聚类来更新知识库以反映网络访问的最近状态。在入侵检测数据集KDDCup99上进行实验,当初始聚类的样本数为10 000,缓冲区聚类的样本数为10 000,调节系数为0.9时,召回率达到91.92%,误报率达到0.58%,接近传统非实时检测模式的结果,但整个学习和检测过程只需扫描网络访问数据一次,并引入了知识库的更新机制,在入侵检测的实时性和适应性方面更具有优势。
- 李艳红李德玉崔梦天李华
- 关键词:数据流入侵检测知识库信息熵
- 基于粗糙集的多标记专属特征学习算法被引量:10
- 2015年
- 基于专属特征的多标记学习算法使用K-Means聚类算法对标记的正反样例进行聚类,进而构造每个标记的专属特征.但该方法对标记和专属特征之间的相关性缺乏理论性地探究,而且K-Means聚类方法仅仅局限于数值属性数据聚类.对此,一个基于粗糙集的多标记专属特征学习算法(R-LIFT Algorithm)被提出,其使用粗糙集的约简算法来计算每个标记的专属特征.该算法选取的专属特征是原始特征,具有直观意义,并且能够从理论上保证专属特征与标记之间具有较强的相关性.实验表明,R-LIFT算法能够有效地学习专属特征,并进一步提高多标记学习算法的性能.
- 李华李德玉王素格张晶
- 关键词:多标记学习粗糙集
- 基于稳健模糊粗糙集模型的多标记文本分类被引量:7
- 2015年
- 针对多标记数据的不确定性以及噪声数据的存在,提出了一种新的多标记稳健模糊粗糙分类模型。该模型是处理单标记分类问题的k-mean稳健统计量模糊粗糙分类模型的扩展应用。对于每个待分类数据,首先根据相似性计算方法,得到它们相对于各标记的隶属度;然后根据隶属度定义待分类数据与各标记的相关度;最后为每一组相关度赋予合适的阈值,得到相关的标记集合。在3个标准多标记数据集和1个真实多标记文本数据集上的实验结果表明,对于多标记文本分类问题,所提模型在6个常用的多标记评测指标上较常用的ML-kNN和rank-SVM多标记学习方法具有更高的准确率。
- 张晶李德玉王素格李华
- 关键词:模糊粗糙集多标记学习
- 多标记数据特征提取方法的核改进被引量:4
- 2015年
- 针对多标记数据特征提取方法中输出核函数没有准确刻画标记间的相关性的问题,在充分度量标记间相关性的基础上,提出了两种新的输出核函数构造方法。第一种方法首先将多标记数据转化为单标记数据,并使用标记集合来刻画标记间的相关性;然后从损失函数的角度出发定义新的输出核函数。第二种方法是利用互信息来度量标记间的两两相关性,在此基础上进一步构造新的输出核函数。3个多标记数据集上2种分类器的实验结果表明,与原有核函数对应的多标记特征提取方法相比,基于损失函数的输出核函数对应的特征提取方法性能最好,5个评价指标的性能平均提高了10%左右,尤其在Yeast数据集上,Coverage指标下降幅度达到了30%左右;基于互信息的输出核函数次之,性能平均提高了5%左右。实验结果表明,基于新的输出核函数的特征提取方法能够更加有效地提取特征,并进一步简化分类器的学习过程,提高分类器的泛化性能。
- 李华李德玉王素格张晶
- 关键词:多标记学习核函数损失函数互信息
- 基于粗糙集的多标记变精度属性约简方法
- :多标记数据具有高维性,而有效地特征选择(也称为属性约简)可以去除冗余属性,提高多标记分类器的性能,因此特征选择是多标记学习中的一个热点问题。粗糙集理论,作为一种有效地数据分析工具已经被广泛地应用于特征选择。针对多标记数...
- 李华李德玉翟岩慧王素格张晶
- 关键词:区分矩阵多标记学习粗糙集