甘肃省自然科学基金(1010RJZA022) 作品数:4 被引量:9 H指数:1 相关作者: 蒋芸 王勇 王明芳 明利特 陈建华 更多>> 相关机构: 西北师范大学 西北工业大学 更多>> 发文基金: 国家自然科学基金 甘肃省自然科学基金 更多>> 相关领域: 自动化与计算机技术 更多>>
基于粗糙集和单事务项组合的关联规则挖掘算法 2011年 Apriori算法必须反复地扫描数据库才能求出频繁项集,效率较低,且不支持更新挖掘。为了解决这些问题,提出了一种基于粗糙集、单事务项组合和集合运算的关联规则挖掘算法。本算法首先利用粗糙集进行属性约简,对新决策表中的每个事务进行"数据项"组合并标记地址,然后利用集合运算的方法计算支持度和置信度即可挖掘出有效规则。本算法只需要一次扫描数据库,同时有效地支持了关联规则的更新挖掘。应用实例和实验结果表明,本算法明显优于Apriori算法,是一种有效且快速的关联规则挖掘算法。 王明芳 蒋芸 王勇 明利特 周涛 周泽寻关键词:粗糙集 基于邻域粗糙集和概率神经网络集成的基因表达谱分类方法 被引量:8 2011年 从癌症基因表达谱分析入手,针对基因表达谱维数高、样本少的特点,提出一种用于癌症分类的基于邻域粗糙集和概率神经网络集成的分类方法。首先利用Relief算法对基因进行排序,然后利用邻域粗糙集选取分类特征基因,最后结合概率神经网络集成分类模型进行癌症分类。实验结果表明,该方法可以快速有效地选取癌症特征基因,能获得更好的分类效果。 明利特 蒋芸 王勇 王明芳关键词:基因表达谱 邻域粗糙集 基于类别区分度和关联性分析的综合特征选择 被引量:1 2012年 提出一种基于类别区分度和关联性分析的综合特征选择算法。利用类别区分度提取具有较强类别区分能力的特征词,降低特征空间的稀疏性,通过特征的关联性分析衡量特征与类别的相关性及特征之间的冗余度,选出具有类别代表性且相互之间不存在冗余的特征词。实验结果表明,该算法能有效提高分类器性能。 陈建华 王治和 蒋芸关键词:文本分类 关联性分析 一种改进的文本分类特征选择算法 2011年 现有的一种特征选择算法DPM(Discriminating Power Measure)[1],是通过计算每个特征在某一类别和剩余其他类别中的文档频,比较了特征对一个类别和对其他类别的贡献,提取出具有强类别区分能力的特征词.在研究此特征选择算法的基础上,提出了一种改进的特征选择算法,该算法同时考虑了每个特征的类别频次在计算特征类别区分能力方面的重要性.经实验验证,改进后的特征选择算法能够获得较好的分类效果. 陈建华 王治和 蒋芸 许虎寅 樊东辉关键词:DPM 词频