张金伟
- 作品数:2 被引量:7H指数:1
- 供职机构:中国计量学院信息工程学院更多>>
- 发文基金:浙江省自然科学基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术医药卫生更多>>
- 基于特征选择的过抽样算法的研究被引量:1
- 2012年
- 为了提高不平衡数据集分类中少数类的分类精度,提出了基于特征选择的过抽样算法。该算法考虑了不同的特征列对分类性能的不同作用,首先对训练集进行特征选择,选出一组特征列,然后根据选出的特征列合成少数类样本,合成的每个少数类样本的特征由两部分组成,一部分是特征选择的特征列对应的特征,另一部分是按照SMOTE原理合成的特征。将基于特征选择的过抽样算法和SMOTE算法进行实验比较,结果表明基于特征选择的过抽样算法的性能优于SMOTE算法,能有效降低数据的不平衡性,提高少数类的分类精度。
- 陆慧娟张金伟马小平杨小兵
- 关键词:不平衡数据集过抽样遗传算法
- 极限学习机集成在肿瘤分类中的应用被引量:6
- 2012年
- 提出一种基于数据集分割的极限学习机集成算法——DS-E-ELM.该算法主要包含以下3个步骤:首先,将数据集分成互不相关的κ个子集,选择κ一1个子集组合成一个训练集,这样可以得到κ个不同的数据集;然后将新得到的κ个数据集利用极限学习机训练得到κ个分类器;最后对κ个分类器预测得到的结果通过多数投票的方法决定预测结果.通过对6个肿瘤数据集的实验证明,DS-E-ELM与单独的ELM、Bagging、Boosting等算法相比,具有更高的分类精度,且稳定性更好.
- 陆慧娟张金伟马小平郑文斌
- 关键词:极限学习机肿瘤分类