徐俊
- 作品数:4 被引量:11H指数:2
- 供职机构:华南师范大学计算机学院更多>>
- 发文基金:国家科技支撑计划国家高技术研究发展计划广东省自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 冠字号云存储管理系统设计被引量:3
- 2014年
- 文中云存储纸币冠字号码追踪系统提供冠字号、钞票流转信息以及图像数据等大数据的存储、快速检索、定时数据清理,建立接大数据分析系统,实时并发接收和存储多种生产设备产生的记录数据,形成大数据存储仓库,根据用户需要对大数据执行高速查询分析任务。采用HDFS云存储文件系统,以云服务的形式提供图像的存储、冠字号等数据的高速并行存储,以及所有数据的定时清理、检索服务,实现对海量数据高性能、高可靠性支持和较强的在线扩容能力。
- 徐俊汤庸赵云龙
- 关键词:分布式计算
- 基于混合差分粒子群算法的MapReduce任务调度算法研究被引量:6
- 2016年
- 在复杂网格环境下,MapReduce调度任务如何有效地利用共享可用资源实现最短的时间内完成分配任务,这样的任务分配问题是一个NP难题.提出一种混合差分粒子群算法(HDE-PSO)求解任务调度问题.新的混合差分-粒子群算法(HDEPSO)引入了DE算法的突变和交叉算子,克服传统PSO算法容易陷入局部最优解的缺陷,以增加算法的全局寻优能力.通过实验证明该HDE-PSO算法比传统PSO和DE算法具有更好的收敛性和寻优能力,并能更充分的利用共享资源.
- 徐俊汤庸刘道余
- 关键词:HADOOP差分算法粒子群算法MAPREDUCE
- 基于改进HDFS的冠字号小文件分布式存储研究被引量:1
- 2014年
- 针对冠字号小图片存储到HDFS系统中带来的访问瓶颈问题,改进了原有的HDFS系统,新提出的分布式系统机制是充分基于文件相关性(File Correlation)进行合并处理的HDFS(FCHDFS)。由于HDFS中所有的文件都是由单一的主节点服务器托管-NameNode,每个存储到HDFS的文件在NameNode主存储器中都需要存储它的元数据,这必然导致小文件数量越大HDFS性能就越差。存储和管理大量的小文件,对NameNode是一个沉重的负担。可以存储在HDFS的文件数量是受到NameNode的内存大小约束。为了提高存储和访问HDFS上的冠字号小文件的效率,该文提出了一个基于文件关联性的小文件高效处理机制。在这种方法中,按照客户和时间区分,一组相关的文件相结合为一个大文件,从而减少文件数目。而新建的索引机制能从相应的联合文件中访问单个文件。实验结果表明,FCHDFS大大减少主节点内存中元数据数量,也提高了存储和访问大量小文件的效率。
- 徐俊徐俊王庆华
- 关键词:HADOOPHDFS
- 基于混合粒子群分布估计算法的Hadoop任务调度优化策略被引量:1
- 2015年
- 在一个异构的网格环境下,Hadoop异构任务调度的目的是有效地利用资源和共享可用的资源之间的负载,这样的任务调度问题是NP-Hard问题。提出一种基于混合粒子群分布估计算法(HPSO-EDA)的任务分配策略。新的HPSO-EDA引入分布估计算法的建立概率模型和随机抽样操作来替代速度和位置的更新操作来引导最优解的进化,提高算法的收敛速度,防止算法陷入局部最优化解。通过实验仿真表明:HPSO-EDA比传统PSO和EDA能在更短的时间里产生更好的结果。
- 徐俊汤庸刘道余
- 关键词:HADOOP粒子群MAPREDUCE