祁立
- 作品数:3 被引量:15H指数:2
- 供职机构:北京理工大学更多>>
- 发文基金:国家部委预研基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于聚类粒度的模糊支持向量机被引量:1
- 2006年
- 为了提高模糊支持向量机在大规模数据集上的训练效率,提出了一种基于聚类粒度的模糊支持向量机算法.首先在每类训练样本上执行无监督聚类算法,产生聚类颗粒.在综合考虑了聚类中心、半径和聚类中的样本数目等聚类信息基础上,找到每个聚类内部的边缘点和交叉点集合,去除对分类贡献很小的聚类内部点,最终形成了新的用于模糊支持向量机训练的样本集合.随后的试验结果表明,由聚类颗粒生成的约简样本集合,很好的表示了原有样本的分布,不仅提高了训练效率,同时保持了较好的分类效果.
- 祁立刘玉树
- 关键词:聚类粒度模糊支持向量机
- 基于条件信息量的快速粗集约简算法被引量:9
- 2007年
- 为提高粗集约简的效率,提出了一种基于条件信息量的快速粗集约简算法.该算法定义了基于等价块的信息量与条件信息量,并给出了条件信息量的不变性定理与属性重要度的单调性定理.与其他算法相比较,该算法缩小了实例集合的规模,减少了需要计算重要度的属性个数.实验结果表明,保持约简集合不变的前提下,该算法有效提高了粗集约简的效率.
- 祁立刘玉树
- 关键词:粗糙集条件信息量快速约简算法
- 基于两阶段聚类的模糊支持向量机被引量:5
- 2008年
- 为了提高模糊支持向量机在大数据集上的训练效率,提出一种基于两阶段聚类的模糊支持向量机算法。第1阶段为粗粒度聚类阶段,在每类训练样本上执行密度聚类算法,设置较大的邻域半径(给定邻域内最小点数),保证可能成为支持向量的样本点都被选取;第2阶段为自适应聚类阶段,在粗选的数据集合上,执行自适应密度聚类算法,根据各个点距离分类面的远近,自适应决定该点的邻域半径(给定邻域内最小点数)。这样可有效地减少远离分类面的聚类边缘点的数量,同时在分类面附近保持较多的样本点,试验结果表明,基于两阶段聚类模糊支持向量机算法,相比以往的方法,不仅提高了模糊支持向量机的训练效率,同时保持了较好的分类效果。
- 祁立刘玉树
- 关键词:密度聚类支持向量模糊支持向量机