广西工学院自然科学基金(1074011)
- 作品数:1 被引量:5H指数:1
- 相关作者:覃希苏一丹更多>>
- 相关机构:广西大学广西科技大学更多>>
- 发文基金:广西工学院自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 用双层减样法优化大规模SVM垃圾标签检测模型被引量:5
- 2011年
- 针对支持向量机在训练大规模数据集时出现的速度瓶颈问题,提出一种新的减样方法,称为双层减样法。数据减样时,双层减样法从粗、细粒度两个层次削减样本。粗粒度约减时,利用核空间距离聚类法,以簇为单位削减冗余子集;细粒度约减时,以点为单位挑选剩余点集中的支持向量。实验表明,双层减样法能有效地压缩样本数据,同时还能放大数据集的分类特征,提高分类器的分类精度。将此法应用于大规模SVM垃圾标签检测模型的训练集优化上,能明显提高检测模型的训练速度。双层减样法将粒度和层次的概念引入减样法中,在约减时适时改变约减幅度,这比传统减样法更具有优势。
- 覃希苏一丹
- 关键词:FOLKSONOMY支持向量机