刘福伦
- 作品数:4 被引量:11H指数:2
- 供职机构:西南石油大学计算机科学学院更多>>
- 发文基金:国家自然科学基金四川省教育厅自然科学科研项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 邻域覆盖分类的两种加权策略被引量:1
- 2018年
- 邻域覆盖粗糙集在机器学习的理论与应用中都起着重要作用。结合覆盖约简和代表选择,已有的研究在符号数据上取得了很好的分类结果;然而,已有方法使用简单投票策略,不能有效解决分类冲突问题。对此提出两种新的加权策略,在分类阶段确定投票的模式。第一种基于Cfs Subset EVal和Best First根据属性重要度加权,第二种基于预测点与代表的Overlap相似度加权。利用加州大学欧文分校(UCI)的10个公开数据集进行实验,并与其他三种常用分类算法进行对比。实验用F-measure值对算法性能进行评定。实验结果表明,两种新策略均能提升分类精度,其中属性加权策略效果更明显。此外,属性加权策略特别适用于对生命领域数据集进行分类。
- 王轩刘福伦张林王宏杰闵帆
- 关键词:相似度覆盖约简
- 基于PageRank的主动学习算法被引量:1
- 2019年
- 在许多分类任务中,存在大量未标记的样本,并且获取样本标签耗时且昂贵。利用主动学习算法确定最应被标记的关键样本,来构建高精度分类器,可以最大限度地减少标记成本。本文提出一种基于PageRank的主动学习算法(PAL),充分利用数据分布信息进行有效的样本选择。利用PageRank根据样本间的相似度关系依次计算邻域、分值矩阵和排名向量;选择代表样本,并根据其相似度关系构建二叉树,利用该二叉树对代表样本进行聚类,标记和预测;将代表样本作为训练集,对其他样本进行分类。实验采用8个公开数据集,与5种传统的分类算法和3种流行的主动学习算法比较,结果表明PAL算法能取得更好的分类效果。
- 邓思宇刘福伦黄雨婷汪敏
- 关键词:PAGERANK聚类二叉树
- SUCE:基于聚类集成的半监督二分类方法被引量:4
- 2018年
- 半监督学习和集成学习是目前机器学习领域中的重要方法。半监督学习利用未标记样本,而集成学习综合多个弱学习器,以提高分类精度。针对名词型数据,本文提出一种融合聚类和集成学习的半监督分类方法SUCE。在不同的参数设置下,采用多个聚类算法生成大量的弱学习器;利用已有的类标签信息,对弱学习器进行评价和选择;通过集成弱学习器对测试集进行预分类,并将置信度高的样本放入训练集;利用扩展的训练集,使用ID3、Nave Bayes、 kNN、C4.5、OneR、Logistic等基础算法对其他样本进行分类。在UCI数据集上的实验结果表明,当训练样本较少时,本方法能稳定提高多数基础算法的准确性。
- 闵帆王宏杰刘福伦王轩
- 关键词:聚类聚类集成
- 代价敏感代表选举的邻域覆盖粗糙集分类方法被引量:5
- 2017年
- 基于邻域的覆盖粗糙集已经被用于构建数值型数据分类器.文中将该理论应用于针对名词性数据的代价敏感分类器.首先,用对象间的相似关系确定每个对象的相似度阈值,并通过该阈值确定每个对象的邻居以及邻域;然后,通过覆盖约简算法选举出一组称为代表的对象;最后,当需要对新对象进行分类时,计算它与各代表之间的曼哈顿距离,并综合误分类代价向量制定不同分类策略,以最小化误分类代价期望值.在UCI数据库中的数据集之上与主流的代价敏感ID3和C4.5算法对比,结果表明新算法能取得更好的分类效果.
- 刘福伦闵帆张本文
- 关键词:相似度