杨峻山
- 作品数:7 被引量:7H指数:2
- 供职机构:深圳大学更多>>
- 发文基金:国家自然科学基金广东省自然科学基金更多>>
- 相关领域:自动化与计算机技术电子电信生物学更多>>
- 基于粒子群优化的生物组学数据分类模型选择被引量:2
- 2016年
- 针对生物组学数据普遍存在的高维小样本和样本分布不平衡问题,提出基于粒子群优化分类模型选择算法.该算法中粒子编码由样本平衡模型、特征选择模型和分类模型及超参数构成,粒子种群以达到以生物组学数据最佳分类性能为目标,通过对粒子的速度和位置进行迭代更新,得到模型组合及超参数的最优解.在8组真实生物组学数据集上的实验结果表明,所提模型选择算法能够避免人为选择所带来的主观偏差,提高最佳分类性能和稳定性.
- 杨峻山纪震谢维信朱泽轩
- 关键词:粒子群优化数据挖掘
- 多类不平衡基因组学数据迭代集成特征选择方法及系统
- 本发明公开多类不平衡基因组学数据迭代集成特征选择方法及系统。本发明针对多类标基因组学数据存在数据分布不平衡的特点,提出了一种迭代式的特征选择方法,在一对多集成分类器的基础上,将欠采样或过采样和特征选择迭代运行,使子数据集...
- 杨峻山纪震朱泽轩周家锐殷夫
- 文献传递
- 一种集成特征选择方法及系统
- 本发明公开一种集成特征选择方法及系统。本发明采用集成学习技术充分利用搜索算法找到的多个特征子集,并基于多特征子集建立的基分类器集成为强分类器并对数据进行分类学习。该特征选择方法能在生物组学数据上稳定选择较少特征并获得较好...
- 杨峻山纪震朱泽轩周家锐殷夫
- 文献传递
- 生物组学数据的集成特征选择研究
- 高通量技术的发展产生了大量与基因、蛋白质和代谢相关的生物组学数据。从生物组学数据中发现和提炼与疾病相关的信息一直是生物信息学领域的热点问题。通过模式识别中的特征选择和分类技术,对高维生物组学数据中蕴藏的重要信息进行提取、...
- 杨峻山
- 关键词:粒子群优化算法
- 文献传递
- 多类不平衡基因组学数据迭代集成特征选择方法及系统
- 本发明公开多类不平衡基因组学数据迭代集成特征选择方法及系统。本发明针对多类标基因组学数据存在数据分布不平衡的特点,提出了一种迭代式的特征选择方法,在一对多集成分类器的基础上,将欠采样或过采样和特征选择迭代运行,使子数据集...
- 杨峻山纪震朱泽轩周家锐殷夫
- 文献传递
- 带约束小生境二进制粒子群优化的生物组学数据集成特征选择被引量:3
- 2016年
- 针对生物组学数据高维小样本的特点而引起的分类误差较大的问题,提出了一种带约束小生境二进制粒子群优化的集成特征选择方法。该方法利用二进制粒子群优化算法搜索分类准确率最高的特征子集,通过约束粒子编码的置位个数以限制选择特征个数,并加入多模优化中的小生境技术使算法能够一次获得多个差异度较大的特征子集,最后采用集成学习技术将基于多特征子集建立的基分类器集成为强分类器并对数据进行分类学习。实验结果表明,该特征选择方法在生物组学数据上能够稳定选择较少特征并获得较好分类性能。
- 杨峻山周家锐朱泽轩纪震
- 关键词:粒子群优化小生境
- 一种带约束小生境粒子群优化的集成特征选择方法及系统
- 本发明公开一种带约束小生境粒子群优化的集成特征选择方法及系统。本发明针对生物组学数据高维小样本的特点而引起的分类误差较大的问题,提出了一种基于带约束小生境二进制粒子群优化的集成特征选择方法。该方法利用二进制粒子群优化算法...
- 杨峻山纪震朱泽轩周家锐殷夫
- 文献传递