肖文
- 作品数:8 被引量:24H指数:3
- 供职机构:河海大学文天学院更多>>
- 发文基金:安徽省高校省级自然科学研究项目更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 稀疏数据频繁项集挖掘算法研究综述
- 频繁项集挖掘(Frequent Itemset Mining,FIM)是最重要的数据挖掘任务之一,被挖掘数据集的特征对FIM算法的性能有着显著影响.在大数据时代,稀疏是大数据的典型特征之一,对传统FIM算法的性能带来严峻...
- 肖文胡娟
- 关键词:稀疏数据频繁项集挖掘
- 稀疏数据频繁项集挖掘算法研究综述被引量:5
- 2019年
- 频繁项集挖掘FIM是最重要的数据挖掘任务之一,被挖掘数据集的特征对FIM算法的性能有着显著影响。在大数据时代,稀疏是大数据的典型特征之一,对传统FIM算法的性能带来严峻挑战。针对在稀疏数据中如何高效进行FIM的问题,从稀疏数据的特征出发,分析了稀疏数据对3种类型FIM算法性能的主要影响,对已经提出的稀疏数据FIM算法进行了综述,对算法中采用的优化策略进行了讨论,最后通过实验对代表性的稀疏数据FIM算法进行了性能分析。实验结果表明,采用伪构造策略的模式增长算法最适合用于稀疏数据的FIM,在运算时间和存储空间上,相比其他算法该算法具有较大的优势。
- 肖文胡娟
- 关键词:大数据稀疏数据频繁项集挖掘性能分析
- 独立学院转型发展目标与路径探析被引量:2
- 2017年
- 在国家经济转型升级、教育供给侧改革和地方本科院校转型发展的新形势下,独立学院要以"创新驱动"理念为引领,实施转型发展策略,着力提高应用型人才培养质量。独立学院要科学目标定位、坚持问题导向,在客观分析转型发展挑战与机遇的基础上,坚持学科专业建设龙头地位,通过人才培养模式改革、深化创新创业教育、建设双能型师资队伍、提高应用型科研和技术服务水平等途径实现转型发展,提高办学质量和水平,服务地方经济社会发展。
- 肖文黄翠
- MRClose:一种基于MapReduce的并行闭频繁项集挖掘算法
- 2017年
- 频繁项集挖掘是最重要的数据挖掘任务之一,闭频繁模式项集是频繁项集的一种无损压缩形式,具有挖掘效率高、无冗余信息等优点。在大数据时代,基于单机的闭频繁项集挖掘算法不能适应海量数据的挖掘需求,需要并行的算法来解决。本文分析了并行闭频繁项集挖掘中搜索空间划分、剪枝策略的策略选择,设计了一种并行的全局闭项集筛选方法,提出一种基于Map Reduce计算模型的并行闭频繁项集挖掘算法MRClose。实验表明提出的算法实现了较好的均衡负载和低I/O量,在执行效率和结果压缩两方面较并行频繁项集挖掘算法具有更好的效果。
- 胡娟肖文
- 关键词:数据挖掘MAPREDUCEHADOOP
- 论“中国制造2025”背景下地方普通本科高校向应用型大学转型被引量:3
- 2016年
- "中国制造2025"战略的实施关键在于人才,为了满足制造业发展和转型对应用型技术人才的需求,地方普通本科高校向应用型转型势不可挡。通过分析地方普通本科高校向应用型转型面临的困境,提出推进应用型转型的措施。
- 郭凡肖文黄翠
- 应用型大学创新创业教育与专业实践教育融合途径探析被引量:4
- 2018年
- 深化创新创业教育是当前高校教学改革的主要方向,促进双创教育与专业实践教育融合是提升双创教育效果、提高应用型人才培养质量的重要举措。论文探讨了双创教育与专业实践教育融合的价值,提出了更新教育教学理念、融合教学目标和内容、改革教学和评价方法三条融合途径,最后对促进两者融合的保障机制进行了阐释。
- 肖文朱昌平
- 关键词:创新创业教育专业实践教学
- PFPonCanTree:一种基于MapReduce的并行频繁模式增量挖掘算法被引量:8
- 2018年
- 频繁模式挖掘是最重要的数据挖掘任务之一,传统的频繁模式挖掘算法是以"批处理"方式执行的,即一次性对所有数据进行挖掘,无法满足不断增长的大数据挖掘的需要。MapReduce是一种流行的并行计算模式,在并行数据挖掘领域已得到了广泛的应用。将传统频繁模式增量挖掘算法CanTree向MapReduce计算模型进行了迁移,实现了并行的频繁模式增量挖掘。实验结果表明,提出的算法实现了较好的负载均衡,执行效率有明显提升。
- 肖文胡娟周晓峰
- 关键词:数据挖掘频繁模式挖掘MAPREDUCEHADOOPPFP