朱艳玲
- 作品数:2 被引量:4H指数:1
- 供职机构:郑州轻工业学院计算机与通信工程学院更多>>
- 发文基金:河南省教育厅科学技术研究重点项目河南省高等学校青年骨干教师资助计划项目河南省科技攻关计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于K-Means和Apriori算法的多层特征提取方法被引量:3
- 2015年
- 根据科技文献的结构特点,论文提出了一种四层挖掘模式,并结合K-means算法和Apriori算法,构建一个新的特征词提取方法——MultiLM-FE方法.该方法首先依据科技文献的结构将其分为4个层次,然后通过K-means聚类对前3层逐层实现特征词提取,最后再使用Aprori算法找出第4层的最大频繁项集,并作为第4层的特征词集合.该方法能够解决K-means算法不能自动确定最佳聚类初始点的问题,减少了聚类过程中信息损耗,这使得该方法能够在文献语料库中更加准确地找到特征词,较之以前的方法有很大提升,尤其是在科技文献方面更为适用.实验结果表明,该方法是可行有效的.
- 钱慎一朱艳玲朱颢东
- 关键词:特征提取K-MEANS算法APRIORI算法
- 基于多层挖掘策略的特征选择及在科技文献分类中的应用被引量:1
- 2015年
- 提出一种应用于科技文献分类的文本特征选择方法.该方法运用了聚类与关联规则的思想,对文本特征进行逐层选择.同时为提高K-means算法的聚类性能,对K-means算法做了相应的改进,通过为算法的终止条件设定标准值来减少算法迭代次数,减少学习时间;通过删除由信息动态变化而产生的冗余信息,来减少动态聚类过程中的干扰.采用KNN分类器进行对比实验,实验结果表明,该特征选择方法在科技文献分类方面有较高的准确率.
- 钱慎一朱艳玲朱颢东
- 关键词:K-MEANSAPRIORI