王志刚
- 作品数:7 被引量:115H指数:4
- 供职机构:东北大学计算机科学与工程学院更多>>
- 发文基金:中央高校基本科研业务费专项资金国家自然科学基金国家教育部博士点基金更多>>
- 相关领域:自动化与计算机技术冶金工程金属学及工艺更多>>
- 基于模糊聚类和最小二乘回归的罩式退火炉冷却时间预报
- 按照退火计划内各钢卷的钢种和厚度对退火中的冷却工艺进行分类,将罩式退火炉冷却时间预报的多入单出建模问题化为一组单入单出建模问题.采用模糊C均值聚类方法对退火实绩数据进行处理,再基于得到的聚类数据点进行指数最小上二乘回归....
- 刘全利王志刚王晓东王伟
- 关键词:模糊聚类退火优化调度
- 文献传递
- 铝用阴极节能技术被引量:2
- 1995年
- 本文介绍铝用阴极的概念和其分类、预焙阴极炭块分类及其理化指标和铝用阴极的几项节能技术。节能不仅指降低阴极(或称炉底)压降,而且包括改善侧壁材料和保温材料以及采用适宜的物理或化学挡板,铝电解槽的寿命也会延长。
- 路忠胜王志刚王风宝丛干臣王雪亭
- 关键词:阴极节能炼铝电解精炼
- 云计算环境下的大规模图数据处理技术被引量:102
- 2011年
- 随着社交网络分析、语义Web分析、生物信息网络分析等新兴应用的快速增长,对亿万个顶点级别大规模图的处理能力的需求愈加迫切,这是当前高性能计算领域的研究和开发热点.文中结合云计算的特点,从图数据管理与图数据处理机制两个方面,综述了云计算环境下进行大规模图数据处理的关键问题,包括图数据的存储方式、图索引结构、图分割策略、图计算模型、消息通信机制、容错管理、可伸缩性、图查询处理等.全面总结了当前的研究现状和进展,详细分析了存在的挑战性问题,并深入探讨了未来的研究方向.
- 于戈谷峪鲍玉斌王志刚
- 关键词:云计算数据管理分布式计算
- BHP:面向BSP模型的负载均衡Hash图数据划分被引量:5
- 2014年
- 图数据划分是基于BSP(bulk synchronous parallel)编程模型的大规模图处理系统中一个关键技术问题。传统的图划分技术需要多次迭代,时间复杂度过高,且划分结果不具有图顶点到分区的映射信息,因此这些算法并不适用于BSP模型下的数据划分。提出了一种新的面向BSP模型的负载均衡Hash数据划分算法(balanced Hash partition,BHP)。为了实现各个分区的出边数尽可能均衡,该算法引入了虚拟桶的概念,通过贪婪算法将虚拟桶重组为实际分区,保证了每个实际分区负载均衡,同时数据本地化策略使本分片上的数据尽可能地保留在本节点上,从而减小在数据加载时的数据迁移开销。从三个方面对比了BHP算法和经典Hash算法的性能,结果表明BHP算法能够提高作业的执行效率,减少消息发送的数量,有效解决了经典Hash算法的负载不均衡和分区间交互边过多的问题,当数据量变大时,效果尤为明显。
- 周爽鲍玉斌王志刚冷芳玲于戈邓超郭磊涛
- 关键词:BSP模型图划分负载均衡
- OnFlyP:基于定向边交换的分布式在线大图划分算法被引量:5
- 2015年
- 随着大数据时代的到来,基于云环境的大图迭代计算已经成为新的研究热点,其中提高图划分算法的执行效率和降低划分后子图之间的通信边规模是改善计算性能的关键.已有工作主要分为离线划分和在线划分两大类,无法在执行效率和通信边规模方面同时满足迭代处理需求.文中针对真实世界的大图,提出了聚簇系数概念,定量分析了顶点分布的局部性,以此为基础设计了一种基于定向边交换模型的分布式在线图划分算法(OnFlyP),可在迭代计算的数据加载阶段快速完成图划分,同时通过出边的交换有效降低通信边规模,以满足迭代计算需求.OnFlyP采用实时控制和最小对称矩阵控制实现负载均衡,前者具有较高的执行效率,而后者对降低通信边规模有较好的优化效果,可根据实际应用的处理需求灵活选择.最后,作者使用多种真实数据验证了OnFlyP算法的有效性.
- 王志刚谷峪鲍玉斌于戈
- 关键词:实时控制
- 面向磁盘驻留的类Pregel系统的多级容错处理机制被引量:1
- 2016年
- 基于BSP模型的分布式框架已经成为大规模图高频迭代处理的有效工具.分布式系统可以通过增加集群节点数量的方式提供弹性的处理能力,但同时也增加了故障发生的概率,因此亟需开发高效的容错处理机制.现有工作主要是基于检查点机制展开研究,包括数据备份和故障恢复2部分:前者没有考虑迭代过程中参与计算的数据规模的动态变化,而是备份所有图数据,因此引入了冗余数据的写开销;后者通常是从远程存储节点上读取备份数据进行故障恢复,而没有考虑利用本地磁盘数据恢复某些场景下的故障,引入额外的网络开销.因此提出了一种多级容错处理机制,将故障分为计算任务故障和计算节点故障2类,并设计了不同的备份和恢复策略.备份阶段利用了某些应用在迭代计算过程中参与计算的数据规模的动态变化特性,设计了完全备份和写变化log自适应选择的策略,可以显著减少冗余数据的写开销.故障恢复阶段,对任务故障,利用本地磁盘上保留的图数据和远程的消息数据完成恢复;而对节点故障,则利用备份在远程信息进行恢复.最后,通过在真实数据集上的大量实验,验证了提出的多级容错机制的有效性.
- 毕亚辉姜苏洋王志刚冷芳玲鲍玉斌于戈钱岭
- 关键词:容错迭代计算BSP模型检查点
- BSP模型下基于边聚簇的大图划分与迭代处理被引量:4
- 2015年
- 近年来随着互联网的普及和相关技术的日益成熟,大规模图数据处理成为新的研究热点.由于传统的如Hadoop等通用云平台不适合迭代式地处理图数据,研究人员基于BSP模型提出了新的处理方案,如Pregel,Hama,Giraph等.然而,图处理算法需要按照图的拓扑结构频繁交换中间计算结果而导致巨大的通信开销,这严重地影响了基于BSP模型的系统的处理性能.首先从降低消息通信的角度分析当前主流BSP系统的处理方案,然后提出了一种基于边聚簇的垂直混合划分策略(EC-VHP),并建立代价收益模型分析其消息通信优化的效果.在EC-VHP的基础上,提出了一个点-边计算模型,并设计了简单Hash索引和多队列并行顺序索引机制,进一步提高消息通信的处理效率.最后,在真实数据集和模拟数据集上的大量实验,验证了EC-VHP策略和索引机制的正确性和有效性.
- 冷芳玲刘金鹏王志刚陈昌宁鲍玉斌于戈邓超
- 关键词:BS图划分索引结构