郭明
- 作品数:2 被引量:7H指数:2
- 供职机构:湖北大学计算机与信息工程学院更多>>
- 发文基金:国家自然科学基金湖北省自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于相对细化量的粗糙集属性约简算法被引量:2
- 2015年
- 属性约简是指将信息表中不影响决策或者分类的多余属性去掉,是粗糙集理论研究中的一个核心内容。现已证明寻找信息表的最小约简是一个NP-hard问题。目前提出的启发式算法一般没有同时考虑算法完备性和数据噪音这两个方面。在分析了属性的重要性是与其细化能力相关的基础上,提出使用相对细化量作为启发式信息的属性约简算法REDA。该算法能解决数据中的噪音问题,且从理论上和实例中证明是完备和有效的,而且求得最小约简的可能性要高于其它基于属性重要性的算法。实验也表明,REDA是一个高效的属性约简算法,能够有效地降低后继工作的时间和空间复杂度。
- 徐婕郭明
- 关键词:粗糙集属性约简
- MapReduce Shuffle性能改进被引量:5
- 2017年
- 针对Reduce端从Map端拷贝大量结果数据耗时长的问题,提出一种新方案即对Map节点上同一个作业的多个Map任务所产生的大量临时结果数据进行合并,以取代原有Map Reduce架构对单个Map任务的结果数据作合并的机制。该方案减少了Map节点的输出结果数据量,能减少整个集群的网络传输数据量,节省Reduce端拷贝Map端输出数据的时间,从而减少了Map Reduce作业执行时间,提升了Map Reduce的执行性能。
- 熊倩张郭明徐婕
- 关键词:HADOOPMAPREDUCESHUFFLE