海南省自然科学基金(807050)
- 作品数:6 被引量:8H指数:2
- 相关作者:吴洪丽周瑞琼朱颢东林明才康耀红更多>>
- 相关机构:海南师范大学中国科学院成都计算机应用研究所海南大学更多>>
- 发文基金:海南省自然科学基金四川省科技计划项目国家自然科学基金更多>>
- 相关领域:自动化与计算机技术理学文化科学更多>>
- 基于两种特征贡献度的特征选择
- 2010年
- 特征选择是提高文本分类性能的一个重要手段。论文首先定义了两种特征贡献度:一个是特征对类间文档分散程度的贡献度,该贡献度越大越好;另一种是特征对类内文档分散程度的贡献度,该贡献度越小越好。然后把这两种特征贡献度有机地结合起来设计了一个新的特征选择方法,该方法能够对所选特征进行综合考虑,从而使获得的特征集具有较好的代表性。仿真实验表明:所提特征选择方法在一定程度上能够提高文本分类性能。
- 周瑞琼朱颢东吴洪丽
- 关键词:文本分类
- 使用特征分辨率和差别对象对集的特征选择
- 2010年
- 特征选择是文本分类的关键步骤之一,所选特征子集的优劣直接影响文本分类的结果。首先简单分析了几种经典的特征选择方法,总结了它们的不足,然后提出了特征分辨率的概念,并提出了一个基于差别对象对集的属性约简算法,最后把该属性约简算法同特征分辨率结合起来,提出了一个新的特征选择方法。该方法首先利用特征分辨率进行特征初选以过滤掉一些词条来降低特征空间的稀疏性,然后利用所提属性约简算法消除冗余,从而获得较具代表性的特征子集。实验结果表明此种特征选择方法效果良好。
- 吴洪丽朱颢东周瑞琼
- 关键词:文本分类属性约简
- 新的采用球面杂交的克隆选择算法
- 2010年
- 针对传统克隆选择算法的不足,提出了一个基于球面杂交的新型克隆选择算法。在该算法的每次迭代过程中,动态地计算出每个抗体的变异概率,根据抗体的亲和度将抗体种群动态分为记忆单元和一般抗体单元,并以球面杂交方式对种群进行调整,从而加快了算法的全局搜索速度。实例验证了所提算法的有效性、可行性。
- 周瑞琼吴洪丽
- 关键词:克隆选择算法
- 基于科研立项管理应用的模糊C均值算法研究被引量:4
- 2010年
- 为解决科研重复立项及低水平重复研究问题,分析了科研项目文本的特点,提出了一种改进的模糊聚类算法RM-FCM。该算法充分考虑不同属性的特征项对科研项目分析的支持度,先用科研领域作为初始聚类中心,用参数调节科研文本各部分的重要性,然后不断计算各部分对中心的隶属度来确定聚类中心,最后通过聚类分析挖掘项目的相似性和项目间蕴涵的关联关系。实验结果表明,RM-FCM算法不仅准确地找出相似项目,也可以找出创新项目和交叉学科项目。
- 林明才康耀红张诚一
- 关键词:聚类
- 基于模糊集的连续域决策表属性约简算法被引量:2
- 2010年
- 把模糊集和粗糙集结合起来,对连续域决策表属性约简算法进行研究。使用三角隶属度函数将连续属性值转化为模糊值。定义两模糊对象间的相似度、模糊对象的相似类以及连续属性在对象集上划分所形成的相似类集组成的特征向量。给出连续型属性的数字特征向量,以此为基础建立连续型属性间的相似矩阵。提出一个新的属性约简算法,并用一个实例加以验证。
- 周瑞琼朱颢东吴洪丽
- 关键词:模糊集相似矩阵属性约简
- 文本聚类技术在科研立项管理中的应用被引量:2
- 2009年
- 针对科研管理中存在的重复立项及低水平重复研究问题,运用文本聚类方法对科研项目进行聚类,根据聚类结果分析项目的相似性,从中发现相同、相似和创新性项目。实验结果表明,文本聚类技术可以为科研管理决策提供一种有效的工具,它在科研立项中的应用将大大提高高校科研管理水平和管理效益。
- 林明才康耀红钟声张诚
- 关键词:文本聚类