陈森平
- 作品数:6 被引量:17H指数:3
- 供职机构:暨南大学信息技术研究所更多>>
- 发文基金:广东省科技计划工业攻关项目广东省教育科研项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 支持向量机的一种特征选取算法被引量:5
- 2009年
- 支持向量机(Support Vector Machine,SVM)是一种有效的分类方法,其学习本质是通过对偶问题求解原问题,但是它不能直接获得特征重要性。提出一种新的特征选取算法,实验表明,该特征选取算法与一般特征选取算法(如F-Score算法)相比,对同一测试数据集计算的结果具有相同的降序排列结果,而且有更好的特征刻画量化指标,分界线更明显,表明新的特征选取算法具有更佳的合理性。
- 陈启买陈森平
- 关键词:支持向量机特征选取
- 基于核函数的支持向量机样本选取算法被引量:5
- 2010年
- 使用支持向量机求解大规模数据分类需要较大内存来存储Hessian矩阵,而矩阵的大小则依赖于样本数,因此在一定程度上导致支持向量机分类效率及质量难以提高。考虑到只有成为支持向量的样本才对决策函数起作用,为了减少训练样本时所需空间及时间开销,提高支持向量机分类效率与质量,提出了一种基于核函数的样本选取算法。该算法通过选取最大可能成为支持向量的样本,以达到减少训练时存储Hessian矩阵所需空间及时间开销的目的。实验结果表明,该算法所筛选出的样本不仅可以提高样本训练准确率,而且可以提高分类计算速度和减少存储空间开销。
- 陈启买陈森平
- 关键词:支持向量核函数支持向量机
- 基于核函数的层次聚类算法被引量:4
- 2011年
- 层次聚类算法是运行复杂度较高的聚类算法,基于不相似性测度的层次聚类算法不适合稀疏高维数据.结合核函数特点,提出了一种基于核函数的层次聚类算法.利用该算法,对稀疏高维数据进行了层次聚类对比,实验结果表明,该算法提高了层次聚类的准确率.
- 陈森平陈启买吴志杰
- 关键词:核函数层次聚类
- 基于熵的K均值算法的改进被引量:2
- 2008年
- 在高维数据中,K-means的相似度度量会遇到不同尺度、不同类型的数据等一些问题。本文提出了利用数据归一化预处理方法来改进K-means算法。在讨论一维数据初始中心点选取方法基础上,提出了基于熵的高维数据的初始中心点选取方法,通过对初始中心点选取方法的改进来减少K均值算法的迭代次数。实验结果表明,数据的归一化处理可以从根本上消除了数据类型的不一致对聚类的影响。
- 陈森平陈启买
- 关键词:均值聚类
- 基于支持向量机的大规模数据分类研究及应用
- 支持向量机(SVM)作为一种新兴的基于统计学习理论的分类算法,具有坚实的理论基础,巧妙的算法实现和卓越的性能。其核心思想是将一个复杂的分类任务通过核函数映射使之转化成一个高维特征空间中构造线性分类超平面的问题。与其它分类...
- 陈森平
- 关键词:数据挖掘支持向量机特征选取稀疏数据
- 文献传递
- 基于最大间隔的支持向量机特征选取算法研究被引量:1
- 2010年
- 支持向量机(Support Vector Machine,简称SVM)是一种有效分类方法.不同特征选取算法对分类器影响不同,结合支持向量机特点,提出了一种基于最大间隔的支持向量机特征选取算法.利用该算法,对Iris测试数据集进行了特征选取并仿真,实验结果表明,该算法不但能够有效去除噪音数据,而且提高了分类器推广与泛化能力.
- 陈森平陈启买游才文彭利宁
- 关键词:支持向量机特征选取判据