您的位置: 专家智库 > >

余啸

作品数:3 被引量:6H指数:2
供职机构:武汉大学计算机学院软件工程国家重点实验室更多>>
发文基金:湖北省自然科学基金国家社会科学基金更多>>
相关领域:自动化与计算机技术一般工业技术更多>>

文献类型

  • 3篇中文期刊文章

领域

  • 2篇自动化与计算...
  • 1篇一般工业技术

主题

  • 1篇序列模式挖掘
  • 1篇序列模式挖掘...
  • 1篇数据库
  • 1篇数据筛选
  • 1篇数据挖掘
  • 1篇谱聚类
  • 1篇子序列
  • 1篇模式挖掘算法
  • 1篇聚类
  • 1篇混合式
  • 1篇MAPRED...

机构

  • 3篇湖北大学
  • 2篇武汉大学
  • 1篇华中师范大学

作者

  • 3篇余啸
  • 2篇马传香
  • 1篇李伟亮
  • 1篇金聪
  • 1篇张建升

传媒

  • 2篇计算机应用研...
  • 1篇湖北大学学报...

年份

  • 1篇2018
  • 1篇2017
  • 1篇2015
3 条 记 录,以下是 1-3
排序方式:
基于MapReduce的序列模式挖掘算法被引量:4
2015年
针对传统GSP算法需要多次扫描数据库、I/O开销巨大的缺点,提出了一种基于MapReduce编程框架的序列模式挖掘算法MR-GSP(GSP algorithm based on MapReduce)。MR-GSP算法将原序列数据库划分为多个子序列数据库并分发到多个Map节点,Map函数扫描存放在Map节点内存中的子序列数据库,产生局部序列模式,Reduce函数对所有局部序列模式合并,扫描原序列数据库,计算局部序列模式的支持度,得到最终的序列模式。相比于传统GSP算法,MR-GSP算法只需扫描两次原始数据库即可得到所有序列模式。实验结果表明,MRGSP算法在对大数据集进行序列模式挖掘时,可充分利用云计算技术的优势,提高挖掘效率。
余啸马传香李伟亮金聪
关键词:数据挖掘MAPREDUCE
基于SSDBSCAN的跨项目缺陷预测数据筛选方法
2017年
针对跨项目软件缺陷预测中大量不相关的跨项目数据损害了缺陷预测模型性能的问题,提出了一种基于SSDBSCAN(semi-suppervised density-based clustering)的跨项目缺陷预测数据筛选方法——SSDBSCAN filter.首先,SSDBSCAN filter结合少量带类标号的本项目历史数据、跨项目历史数据和大量不带类标号的本项目数据;然后,利用SSDBSCAN算法对这些数据进行聚类发现子簇;最后,收集子簇中的跨项目数据,不属于任何簇的跨项目数据被作为噪声数据而丢弃.实验使用15个公开的PROMISE数据集,3种分类器和4种性能度量指标.实验结果表明,相比于目前已有的Burak filter和DBSCAN filter方法,SSDBSCAN filter在提高了预测率的同时降低了误报率,且G-measure与AUC度量值更佳.
伍蔓张建升马传香安格格余啸
关键词:数据筛选
面向软件缺陷个数预测的混合式特征选择方法被引量:2
2018年
针对软件缺陷数据集中不相关特征和冗余特征会降低软件缺陷个数预测模型的性能的问题,提出了一种面向软件缺陷个数预测的混合式特征选择方法——HFSNFP。首先,利用Relief F算法计算每个特征与缺陷个数之间的相关性,选出相关性最高的m个特征;然后,基于特征之间的关联性利用谱聚类对这m个特征进行聚类;最后,利用基于包裹式特征选择思想从每个簇中依次挑选最相关的特征形成最终的特征子集。实验结果表明,相比于已有的五种过滤式特征选择方法,HFSNFP方法在提高预测率的同时降低了误报率,且G-measure与RMSE度量值更佳;相比于已有的两种包裹式特征选择方法,HFSNFP方法在保证缺陷个数预测性能的同时可以显著降低特征选择的时间。
马子逸马传香刘瑞奇余啸
关键词:谱聚类
共1页<1>
聚类工具0