范小刚 作品数:4 被引量:12 H指数:2 供职机构: 西南交通大学 更多>> 发文基金: 国家自然科学基金 中央高校基本科研业务费专项资金 中国博士后科学基金 更多>> 相关领域: 自动化与计算机技术 文化科学 更多>>
基于k近邻树的离群检测算法研究 离群检测是数据挖掘的重要分支,离群数据对象隐藏着非常重要的信息和知识,发掘并运用这些财富推动着离群检测的研究。在理论上,研究者们对离群检测的研究取得了巨大的成功。在实际应用中,离群点检测也应用非常广泛,如信用卡欺诈、传感... 范小刚关键词:离群点检测 K近邻 最小生成树 文献传递 基于K-近邻树的离群检测算法 被引量:4 2015年 为适应数据集分布形状多样性以及克服数据集密度问题,针对已有算法对离群簇检测效果欠佳的现状,提出了一种基于K-近邻树的离群检测算法KNMOD(outlier detection based on K-nearest neighborhood MST)。算法结合密度与方向因素,提出一种基于K-近邻的不相似性度量,然后带约束切割基于此度量构建的最小生成树从而获得离群点。算法可以有效地检测出局部离群点以及局部离群簇,与LOF、COF、KNN及INFLO算法的对比结果也证实了算法的优越性能。 范小刚 朱庆生 万家强关键词:离群检测 最小生成树 K-近邻 大规模社交网络情感传播模型研究 随着互联网高速发展和及其移动端应用的兴起,在线社交网络和人们生活、学习和工作等各个方面都密切相关。同时社交网络用户和因频繁交流而产生的有价值信息量的激增,如何从海量的互联网数据中抽取知识和应用知识是目前学者们研究的热点之... 范小刚关键词:社交网络 舆情分析 情感传播 基于群体智能的半结构化藏文文本聚类算法 被引量:7 2014年 将群体智能技术应用于半结构化的藏文Web文本聚类,提出基于群体智能的半结构化藏文Web文本聚类算法(SCAST).充分考虑群体智能技术对藏文文本聚类准确性和时间效率的影响,SCAST算法首先运用向量空间模型表示藏文文本信息,将藏文文本和智能蚁群随机放置于一个文本向量空间中.然后智能蚂蚁随机选择藏文文本,计算藏文文本在当前局部区域内的相似性,获得拾起或者放下文本的概率,进而决定是否"拾起","移动","放下"藏文文本.最后通过多次迭代训练,将藏文文本按其相似性聚集在一起,得到最终聚类结果.大量真实藏文Web文本数据上的实验结果表明,相较于传统的k-means聚类算法,基于群体智能的藏文文本聚类算法在聚类准确率上平均提高约8.0%. 康健 乔少杰 格桑多吉 韩楠 洪西进 尼玛扎西 范小刚关键词:群体智能 藏文 聚类分析