您的位置: 专家智库 > >

江苏省自然科学基金(BK20131378)

作品数:3 被引量:10H指数:2
相关作者:李云周国静陆江余艺吴家皋更多>>
相关机构:南京邮电大学更多>>
发文基金:江苏省自然科学基金国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 3篇中文期刊文章

领域

  • 3篇自动化与计算...

主题

  • 1篇随机子空间
  • 1篇子空间
  • 1篇分布式
  • 1篇RS
  • 1篇SUBSPA...
  • 1篇SVM
  • 1篇MAPRED...
  • 1篇MIN-MA...
  • 1篇并行化
  • 1篇M3

机构

  • 3篇南京邮电大学

作者

  • 3篇李云
  • 1篇吴家皋
  • 1篇周国静
  • 1篇余艺
  • 1篇陆江

传媒

  • 1篇模式识别与人...
  • 1篇南京大学学报...
  • 1篇计算机科学

年份

  • 1篇2015
  • 2篇2014
3 条 记 录,以下是 1-3
排序方式:
基于最小最大策略的集成特征选择被引量:7
2014年
特征选择是机器学习和数据挖掘中的一个关键问题,它可以实现数据维度的约减,从而提高学习模型的泛化能力.近年来,为了提高特征选择算法的性能,集成思想被应用到特征选择算法中,即将多个基特征选择器进行集成.本文从提高特征选择算法对大规模数据处理能力的角度出发,提出了一种基于最小最大策略的集成特征选择方法.它主要包括三个步骤:第一,将原始数据根据类别信息划分成多个相对较小的平衡数据子集;第二,在每一个数据子集上进行特征选择,得到多个特征选择结果;第三,对多个特征选择结果依据最小—最大策略进行集成,得出最终的特征选择结果.通过实验对比了该集成策略与其它三种集成策略对分类准确率的影响,结果表明最小最大集成策略在大部分情况下能够获得较好的性能,且基于最小最大策略的集成特征选择可以有效处理大规模数据.
周国静李云
基于随机子空间的最小最大模块化支持向量机
2014年
最小最大模块化支持向量机(M3-SVM)是一种对大规模数据进行模式分类的有效方法.为进一步提高M3-SVM对高维大规模不平衡数据的分类性能,文中分析多种随机子空间策略,并将其与M3-SVM相结合,以实现降维和增加特征层面上的集成机制,从而得到一类基于随机子空间的最小最大模块化支持向量机(M3-SVM-RS).在现实数据集上验证随机子空间策略的有效性,同时通过实验分析M3-SVM-RS中各个子模块(基分类器)之间的差异性.
余艺吴家皋李云
关键词:SUBSPACERSMIN-MAX
基于MapReduce的特征选择并行化研究被引量:3
2015年
特征选择已经成为一种对高维数据进行预处理的必不可少的手段。随着数据规模的爆炸性增长,传统的特征选择算法已经不能满足当前高维大规模数据的处理要求。采用Google的MapReduce编程模型,设计了一种分布式的基于局部学习的特征选择算法D-logsf。在多个现实和合成数据集上的实验表明,分布式特征选择算法D-logsf具有较好的可靠性,且与传统特征选择算法Logsf相比可以获得接近线性的加速比,同时可以有效处理大规模数据集。
陆江李云
关键词:分布式MAPREDUCE
共1页<1>
聚类工具0