夏海洋
- 作品数:3 被引量:7H指数:2
- 供职机构:西安石油大学计算机学院更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于采样的超球体聚类离群点检测算法被引量:3
- 2018年
- 针对快速超球体聚类的离群点检测算法只能定性地判断数据点是否为离群点,导致离群点的检测精度和召回率较低的问题,提出一种基于采样的超球体聚类的离群点检测算法.通过无放回数据采样将数据集分割为等量的样本子集,在每个样本子集中自适应超球体半径并进行超球体聚类,多次计算数据点的聚集度,取均值得到鲁棒性的聚集度,进而得到离群度.实验证明,该算法可以定量描述离群点,并且在4个真实数据集上,离群点检测的精度提升了1.3%~16.3%,召回率提升了0.2%~7.3%.
- 高荣芳董振涛夏海洋
- 关键词:超球体聚类
- SOM在数据挖掘中的应用
- 2016年
- SOM(Self-Organizing Map)是一种竞争学习型的非监督式神经网络它能将高维输入数据映射到低维空间从而达到很好的可视化效果。本文着重介绍了SOM和MFNN人工神经网络模型的基本原理并对SOM在主流数据挖掘领域中的应用做了简要综述。
- 夏海洋韩家新韦文娟
- 关键词:人工神经网络自组织映射数据挖掘
- 基于Python自然语言处理的文本分类研究被引量:4
- 2016年
- 分类就是为给定的输入选择正确的类标签。在基本的分类任务中,每个输入被认为是与其他的输入隔离的,并且标签集是预先定义的。所以文本分类就是根据预先定义的主题类别,按照一定的规则将文档集合中未知类别的文本自动确定一个类别,它涉及到数据挖掘、计算语义学、信息学、人工智能等个学科,是自然语言处理的一个重要应用领域。目前,越来越多的统计分类方法、机器学习方法、数据挖掘技术和其它的新技术被应用到文本自动分类领域中,同时基于Python自然语言处理的文本分类研究在目前也得到广泛应用。
- 韦文娟韩家新夏海洋
- 关键词:PYTHON自然语言处理文本分类