广东省科技计划工业攻关项目(2012B010100030) 作品数:6 被引量:34 H指数:4 相关作者: 刘波 林伟伟 郭超 陈孝全 潘运军 更多>> 相关机构: 华南师范大学 华南理工大学 更多>> 发文基金: 广东省科技计划工业攻关项目 广东省自然科学基金 国家自然科学基金 更多>> 相关领域: 自动化与计算机技术 更多>>
基于Impala的大数据查询分析计算性能研究 被引量:12 2015年 分析了Cloudera公司推出的Impala实时查询引擎原理与架构,并深入比较Impala与传统MapReduce的性能与特点,针对Impala进行复杂大数据处理方面的不足,提出了MapReduce与Impala结合的大数据处理方法,通过使用MapReduce对Impala的输入数据进行预处理,利用MapReduce在复杂作业处理方面的长处弥补了Impala在这方面的不足。最后对电信手机上网日志进行大数据查询和分析计算实验,实验结果表明,在大数据查询性能方面,基于MapReduce与Impala结合的大数据处理速度比传统MapReduce快了一倍。特别地,在迭代查询实验中,基于MapReduce与Impala结合的处理方法超过传统MapReduce方法八倍以上。基于MapReduce与Impala结合的处理方法在单次查询中的效率仍然高于传统MapReduce;而在迭代查询中,MapReduce与Impala结合的处理方法远远地超过了MapReduce。因此,MapReduce与Impala结合的处理方法能够发挥Impala和Hadoop各自的优点,让处理效率远超传统MapReduce,对于复杂的大数据处理的能力高于Impala。 郭超 刘波 林伟伟关键词:大数据 HADOOP MAPREDUCE IMPALA 查询分析 基于动态带宽分配的Hadoop数据负载均衡方法 被引量:10 2012年 数据负载均衡对Hadoop分布式文件系统(HDFS)性能有着重要的影响,针对HDFS中默认的数据负载均衡方法存在的效率低和缺乏灵活性的不足,文中提出了一种新的动态负载均衡方法,即通过控制变量来动态分配网络带宽以达到数据负载均衡.在此基础上建立了基于控制变量的数据负载均衡数学模型.实验结果表明,文中提出的方法既能保证HDFS的数据访问性能,又能提高集群加入新节点时的数据负载均衡效率. 林伟伟 刘波关键词:HADOOP 负载均衡 带宽 一种基于Hadoop的BIM云服务框架和空间位置检索算法 被引量:4 2014年 云平台存储和管理应用复杂的海量数据已成为必然。建筑信息模型(Building Information Modeling,BIM)是从全工程建设生命周期的视角组织相关数据并协同工作,所以BIM迫切需要云计算的支持。但是面对复杂的BIM应用,如何构建云平台的超级计算模式将是一个巨大的挑战。提出一个面向BIM应用的云服务框架,在Hadoop分布式软件框架上设计了云存储、云平台服务、应用服务和客户端应用四层结构。提出了该框架下的城市空间位置检索算法,该算法采用改进的KD树作为索引表。针对大用户群的并发访问,提出了面向空间位置检索的负载均衡算法,通过统计节点访问频度设计了数据块均衡分布策略。实验表明,该框架组织的建筑信息具有并发处理能力强、响应速度快等特点。 陈泽琳 潘运军 何浥尘 齐德昱关键词:建筑信息模型 KD树 负载均衡 云存储系统的能耗优化节点管理方法 被引量:1 2014年 为节省云存储系统的能耗,文中考虑在云存储系统利用率较低时关闭部分存储节点.为了保证部分存储节点关闭时数据的可用性,针对如何选择云存储系统中可以关闭的节点集合问题,设计了基于辅助节点的贪心算法,并针对异构云存储系统的能耗优化问题,提出了面向异构云存储系统的能耗优化贪心算法.模拟实验结果表明,文中提出的面向异构系统的能耗优化贪心算法能较好地降低异构云存储系统的能耗,其性能明显优于一般的贪心算法,从而验证了所提算法的有效性. 林伟伟 贺品嘉 刘波关键词:数据管理 能耗优化 贪心算法 基于模糊约束理论的B2C交易自动协商模型研究 被引量:1 2012年 分析了B2C交易中协商主体和协商过程的特点,基于带优先级的模糊约束理论为买方协商主体建立了认知模型,能够根据买方主观需求的满足程度和主观忍受程度,综合评估买方的偏好,由此出发设计双方协商策略和协商交互流程,建立了B2C交易自动协商模型,并论证其模型的优越性. 韩海雯 郑伟平关键词:自动协商 基于支持向量机粒化的证券指数预测 被引量:6 2015年 为分析股票价格指数变化,文中提出一种采用近似支持向量机(PSVM)将金融时间序列数据进行模糊信息粒化的方法,并用此方法对上证指数数据进行回归分析预测。其实现过程是以2008年到2013年的上证综指数据建立抛物型模糊粒子,运用近似支持向量机原理,采用交叉验证的方法对相关参数进行寻优,用优化参数对时间序列进行训练,并回归预测模糊粒子的三个参数来确定上证综指的走势变化。对于非线性难预测的股票指数,实验分析比较了实际数据与预测数据,证明具有较好的预测效果。 陈孝全 刘波关键词:股票指数 近似支持向量机