山西省自然科学基金(2009011017-4)
- 作品数:8 被引量:23H指数:3
- 相关作者:石洪波柳亚琴吕小勇李爱军郭姣更多>>
- 相关机构:山西财经大学更多>>
- 发文基金:山西省自然科学基金国家自然科学基金山西省高等学校优秀青年学术带头人支持计划项目更多>>
- 相关领域:自动化与计算机技术经济管理更多>>
- 基于频繁项集的多标签文本分类算法被引量:5
- 2010年
- 针对多标签文本分类问题,提出基于频繁项集的多标签文本分类算法——MLFI。该算法利用FP-growth算法挖掘类别之间的频繁项集,同时为每个类计算类标准向量和相似度阈值,如果文本与类标准向量的相似度大于相应阈值则归到相应的类别,在分类结束后利用挖掘到的类别之间的关联规则对分类结果进行校验。实验结果表明,该算法有较高的分类性能。
- 吕小勇石洪波
- 关键词:相似度频繁项集关联规则
- 贝叶斯分类器的判别式参数学习被引量:6
- 2011年
- 为了提高贝叶斯分类器的分类性能,针对贝叶斯网络分类器的构成特征,提出一种基于参数集成的贝叶斯分类器判别式参数学习算法PEBNC。该算法将贝叶斯分类器的参数学习视为回归问题,将加法回归模型应用于贝叶斯网络分类器的参数学习,实现贝叶斯分类器的判别式参数学习。实验结果表明,在大多数实验数据上,PEBNC能够明显提高贝叶斯分类器的分类准确率。此外,与一般的贝叶斯集成分类器相比,PEBNC不必存储成员分类器的参数,空间复杂度大大降低。
- 石洪波柳亚琴李爱军
- 关键词:贝叶斯网络分类器
- 产生式与判别式组合分类器学习算法被引量:1
- 2010年
- 在AdaBoost集成方法的基础上,研究了一种产生式与判别式模型组合的方法。该算法在每轮中同时学习一个产生式分类器和一个判别式分类器,选择误差率较小的作为个体分类器,然后对所有个体分类器采用加权的方法得到最终分类器。实验结果表明,该方法在准确率和收敛速度上都具有很好的效果。
- 江雪莲石洪波
- 关键词:集成分类器
- 面向电子商务应用的WebGIS系统被引量:2
- 2011年
- 目前WebGIS日渐成为互联网应用的热点之一,然而面向电子商务领域的行业应用地图系统仍然比较少。本文以五金产业为例,阐述了.NET环境下开发基于MapABC API2的web地图应用的设计思路及关键技术,能够满足行业用户的电子商务应用需求。
- 郭姣石洪波王昌
- 关键词:WEBGIS.NET电子商务搜索系统
- 基于GA-CFS属性选择的个人信用评估模型被引量:2
- 2011年
- 属性选择可以有效减少数据的冗余度和降低数据的维度,将GA-CFS属性选择方法引入个人信用评估中,利用CFS评价得到的启发式"价值"作为GA的适应度函数来对个人信用指标体系优化,建立了基于GA-CFS属性选择的个人信用评估模型。在Australian数据集上比较了ID3、NB、Logistic、SMO与GA-CFS属性选择方法和这四种分类算法分别结合执行的结果。实验结果表明,基于GA-CFS属性选择的个人信用评估模型降低了个人信用指标的维度,减少了学习所需的数据量,而且比基于单分类器的个人信用评估模型具有更高的分类准确率。
- 柳亚琴石洪波
- 关键词:个人信用评估遗传算法CFS
- 基于粗糙集的多标签文本分类算法被引量:4
- 2009年
- 将粗糙集优越的约简理论应用于多标签文本分类,提出了基于粗糙集理论的多标签文本分类算法,该算法利用训练阶段得到的各个类别的分类规则与测试实例逐一匹配,得出实例的类标签集合,扩展了粗糙集理论在文本分类中的应用,实验证明算法有效可行。
- 吕小勇石洪波
- 关键词:粗糙集
- 一种基于属性分割的产生式/判别式混合分类器被引量:1
- 2012年
- 为了利用产生式和判别式方法各自的优势,研究了基于属性分割的产生式/判别式混合分类模型框架,提出了一种基于属性分割的产生式/判别式混合分类器学习算法GDGA。其利用遗传算法,将属性集X划分为两个子集XG和XD,并相应地将训练集D垂直分割为两个子集DG和DD,在两个训练子集上分别学习产生式分类器和判别式分类器;最后将两个分类器合并形成一个混合分类器。实验结果表明,在大多数数据集上,混合分类器的分类正确率优于其成员分类器。在训练数据不足或数据属性分布不清楚的情况下,该混合分类器具有特别的优势。
- 石洪波柳亚琴
- 关键词:产生式判别式遗传算法
- 产生式与判别式线性混合分类器被引量:2
- 2012年
- 产生式方法和判别式方法是解决分类问题的两种不同框架,具有各自的优势.为利用两种方法各自的优势,文中提出一种产生式与判别式线性混合分类模型,并设计一种基于遗传算法的产生式与判别式线性混合分类模型的学习算法.该算法将线性混合分类器混合参数的学习看作一个最优化问题,以两个基分类器对每个训练数据的后验概率值为数据依据,用遗传算法找出线性混合分类器混合参数的最优值.实验结果表明,在大多数数据集上,产生式与判别式线性混合分类器的分类准确率优于或近似于它的两个基分类器中的优者.
- 石洪波柳亚琴