隋海峰
- 作品数:6 被引量:26H指数:4
- 供职机构:北京科技大学计算机与通信工程学院更多>>
- 发文基金:国家自然科学基金教育部科学技术研究重点项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 异构分类器融合环境下的非平衡数据分类模型
- 2011年
- 为解决非平衡数据分类中的正样本分类精度不高的瓶颈问题,提出了一种异构分类器融合环境下的非平衡数据分类模型。该模型基于差异采样率的重采样算法和改进的Adaboost算法,融合了SVM和C5.0两种基分类器;基于知识融合机制,采用了独特的分类器选择策略、分类器集成方法、分类决策方案。仿真实验结果表明,SCECM模型分类性能稳定,在非平衡数据集上具有良好的分类性能。
- 翟云杨炳儒周法国隋海峰刘丽珍
- 关键词:非平衡数据分类
- 基于新型集成分类器的非平衡数据分类关键问题研究被引量:8
- 2011年
- 针对非平衡数据分类问题,提出了一种基于差异采样率的重采样算法(differentiated sampling rate algorithm,DSRA),基于DSRA设计了一种新的集成分类器(SVM-Ripper ensemble classifier,SREC)。SREC采用独特的分类器选择策略、分类器集成策略、分类决策方案,可获得较高的分类精度。同时,利用SREC对影响非平衡数据分类的关键问题进行了研究。结果表明,非平衡数据分类问题本质上是由正负样本类间非平衡、类内非平衡、样本规模以及样本非平衡度等诸多因素引起的,只有综合考虑这些因素才能更好地解决非平衡数据分类问题。
- 翟云杨炳儒曲武隋海峰
- 关键词:数据挖掘集成分类器
- 局部敏感非负矩阵分解被引量:5
- 2010年
- 非负矩阵分解是一种新的基于部分学习的矩阵分解方法,反映了人类思维中局部构成整体的概念。算法只将非负矩阵近似地分解成两个非负矩阵的积,忽略了数据几何结构和判别信息。提出了一个局部敏感非负矩阵分解降维算法来克服这一缺点。该算法既保持了数据非负性,又保持了数据的几何结构和判别信息。构造了一个有效的乘积更新算法并且在理论上证明了算法的收敛性。ORL和Yale人脸数据库实验表明该算法性能超过许多已存在的方法。
- 姜伟杨炳儒隋海峰
- 关键词:非负矩阵分解
- 基于混合SVM方法的蛋白质二级结构预测算法被引量:4
- 2011年
- 预测蛋白质二级结构,是当今生物信息学中一个难以解决的问题。由于预测蛋白质二级结构的精度在蛋白质结构研究中起到非常重要的作用,因此在基于KDTICM理论基础上,提出一种基于混合SVM方法的蛋白质二级结构预测算法。该算法有效地利用蛋白质的物化属性和PSI-SEARCH生成的位置特异性打分矩阵作为双层SVM的输入,从而大大地提高了蛋白质二级结构预测的精度。实验比较分析表明,新算法的预测精度和普适性明显优于目前其他典型的预测方法。
- 隋海峰曲武钱文彬杨炳儒
- 关键词:蛋白质二级结构预测
- 分布式数据流挖掘的研究进展被引量:8
- 2012年
- 随着通信技术和硬件设备的不断发展,尤其是小型无线传感设备的广泛应用,数据采集和生成技术变得越来越便捷和趋于自动化,研究人员正面临着如何管理和分析大规模动态数据集的问题。能够产生数据流的领域应用已经非常普遍,例如传感器网络、金融证券管理、网络监控、Web日志以及通信数据在线分析等新型应用。这些应用的特征是环境配备有多个分布式计算节点;这些节点往往临近于数据源;分析和监控这种环境下的数据,往往需要对挖掘任务、数据分布、数据流入速率和挖掘方法有一定的了解。综述了分布式数据流挖掘的当前进展概况,并展望了未来可能的、潜在的专题研究方向。
- 曲武隋海峰杨炳儒谢永红
- 关键词:数据流挖掘数据流
- 自适应半监督边界费舍尔分析被引量:1
- 2011年
- 基于图的半监督算法已经成功地应用于人脸识别中,算法不仅考虑带标签数据而且利用一致性的假设。传统的算法一致性约束是定义在原特征空间中,但是在原特征空间中定义的一致性不是最好的。提出了自适应半监督边界费舍尔分析算法,它将一致性约束定义在原特征空间和期望低维特征空间中。在CMU PIE和YALE-B数据库上进行了实验,结果表明自适应半监督边界费舍尔分析算法在人脸识别率上有显著的提高。
- 姜伟杨炳儒隋海峰