湖北省教育厅科学技术研究项目(D200728002)
- 作品数:2 被引量:3H指数:1
- 相关作者:何婷婷戴文华焦翠珍更多>>
- 相关机构:咸宁学院华中师范大学更多>>
- 发文基金:湖北省教育厅科学技术研究项目国家自然科学基金国家社会科学基金更多>>
- 相关领域:自动化与计算机技术天文地球理学更多>>
- 基于遗传算法的自适应文本模糊聚类研究被引量:2
- 2008年
- 针对FCM聚类算法对初始聚类中心的选择敏感,以及聚类数C难以确定的问题,提出一种基于遗传算法的自适应文本模糊聚类方法。该方法首先将文档集合表示成向量空间模型,并采用一种新型的可变长染色体编码方案,随机选择文本向量作为初始聚类中心形成染色体,然后结合FCM算法的高效性和遗传算法的全局优化能力,通过遗传进化,有效地避免了局部最优解的出现,同时得到了优化的聚类数目和聚类结果。实验表明该算法是一种精确高效的文本聚类方法。
- 戴文华焦翠珍何婷婷
- 关键词:遗传算法FCM聚类文本聚类模糊聚类
- 基于混合并行遗传聚类的文本特征抽取方法研究被引量:1
- 2008年
- 同义词和近义词现象以及强关联语义信息加大了文本向量的特征维数,对文本分类的效率和精度都会带来极大影响。为了有效降低文本向量的特征维数,提出一种基于混合并行遗传聚类的文本特征抽取方法。该方法首先使用K-means聚类算法进行特征词粗粒度聚类,然后采用混合并行遗传算法对各类特征词进行细粒度聚类,最后对各聚类中的特征词进行分析并压缩,得到最终能反映文本类别特征和语义信息的文本特征词集合。实验证明,该方法是一种有效的文本特征抽取方法,能切实提高文本分类的效率和精度。
- 戴文华焦翠珍何婷婷
- 关键词:并行遗传算法K-MEANS聚类特征抽取