国家自然科学基金(61202136) 作品数:13 被引量:24 H指数:3 相关作者: 李雯睿 赵红 朱洁 李滢 杨宁 更多>> 相关机构: 南京晓庄学院 河海大学 东南大学 更多>> 发文基金: 国家自然科学基金 江苏省高校自然科学研究项目 江苏省科技厅基金 更多>> 相关领域: 自动化与计算机技术 更多>>
A Novel Approach for QoS Prediction Based on Bayesian Combinational Model 被引量:3 2016年 As an important factor in evaluating service,QoS(Quality of Service) has drawn more and more concerns with the rapid increasing of Web services. However,due to the great volatility of services in Mobile Internet environments,such as internet of vehicles,Web services often do not work as announced and thus cause unacceptable problems. QoS prediction can avoid failure before it takes place,which is considered a more effective way to assure quality. However,Current QoS prediction approaches neither consider the highly dynamic of Web services,nor maintain good prediction performance all the time. Consequently we propose a novel Bayesian combinational model to predict QoS by continuously adjusting credit values of the basic models so as to keep good prediction accuracy. QoS attributes such as response time,throughput and reliability are used to validate the proposed model. Experimental results show that the model can provide stable prediction results in Mobile Internet environments. Pengcheng Zhang Yingtao Sun Hareton Leung Meijun Xu Wenrui Li基于多GPU并行框架的DNN语音识别研究 被引量:1 2015年 提出了深度神经网络DNN的多GPU并行框架,描述了其实现方法及其性能优化,依托多GPU的强大协同并行计算能力,结合数据并行特点,实现快速高效的深度神经网络训练.对语音识别应用,在模型收敛速度和模型性能上都取得了有效提升——相比单GPU有4.6倍加速比,数十亿样本的训练数天收敛,字错率降低约10%. 杨宁关键词:语音识别 图形处理器 一种环境因素敏感的WebServiceQoS监控方法 被引量:8 2016年 面向服务系统的执行能力依赖第三方提供的服务,在复杂多变的网络环境中,这种依赖会带来服务质量(QoS)的不确定性.而QoS是衡量第三方服务质量的重要标准,因此,有效监控QoS是对Web服务实现质量控制的必要过程.现有监控方法都未考虑环境因素的影响,比如服务器位置、用户使用服务的位置和使用时间段负载等,而这些影响在实际监控中是存在的,忽略环境因素会导致监控结果与实际结果有悖.针对这一问题,提出了一种基于加权朴素贝叶斯算法w BSRM(weightednaive Bayes running monitoring)的Web Service QoS监控方法.受机器学习分类方法的启发,通过TF-IDF(term frequency-inverse document frequency)算法计算环境因素的影响,通过对部分样本进行学习,构建加权朴素贝叶斯分类器.将监控结果分类,满足QoS标准为c_0,不满足QoS标准为c_1,监控时调用分类器得到c_0和c_1的后验概率之比,对比值进行分析,可得监控结果满足QoS属性标准、不满足QoS属性标准和不能判断这3种情况.在网络开源数据以及随机数据集上的实验结果表明:利用TF-IDF算法能够准确地估算环境因子权值,通过加权朴素贝叶斯分类器,能够更好地监控QoS,效率显著优于现有方法. 庄媛 张鹏程 李雯睿 冯钧 朱跃龙关键词:服务质量 深度卷积神经网络的多GPU并行框架 2016年 近年来,深度卷积神经网络在图像识别和语音识别等领域被广泛运用,取得了很好的效果。深度卷积神经网络是层数较多的卷积神经网络,有数千万参数需要学习,计算开销大,导致训练非常耗时。针对这种情况,本文提出深度卷积神经网络的多GPU并行框架,设计并实现模型并行引擎,依托多GPU的强大协同并行计算能力,结合深度卷积神经网络在训练中的并行特点,实现快速高效的深度卷积神经网络训练。 杨宁关键词:GPU 图像识别 大数据 Hadoop下资源匹配最大集作业调度算法 被引量:1 2015年 针对目前层级队列作业调度算法中资源占比高的作业执行效率低的问题,提出一种资源匹配最大集算法。该算法分析作业特征,引入完成度、等待时间、优先级、重调度次数为紧迫值因子,优先考虑资源占比高或等待时间长的作业,以改善作业公平性;采用双队列结构在可用资源总量内优先选择高紧迫值作业,在不同资源占比作业集比较中选择作业数最大集,以实现调度平衡。在与最大最小公平(Max-min fairness)算法的实例对比中发现,该算法可降低作业集平均等待时间、提高资源利用率。实验对比结果表明,该算法可将不同资源占比的单一类型作业集执行时间缩短18.73%,其中资源占比高的作业执行时间缩短27.26%;在混合型作业集中对应的执行时间可分别缩短22.36%与30.28%。所提算法能有效减少资源占比高作业的等待,提高作业整体执行效率。 朱洁 李雯睿 赵红 李滢关键词:HADOOP 作业调度 基于节点集计算能力差异的Hadoop自适应任务调度算法 被引量:3 2016年 针对异构集群任务推测式执行算法存在的任务进度比例固定、落后任务被动选取等问题,提出基于快慢节点集计算能力差异的自适应任务调度算法。该算法量化节点集计算能力差异实现分集调度,并通过节点与任务速率的动态反馈及时更新快慢节点集,提高节点集资源利用率与任务并行度。在两节点集中,利用动态调整任务进度比例判别落后任务,主动选择采用替代执行方式为落后任务执行备份任务的快节点,从而提升任务执行效率。与最长近似结束时间(LATE)算法的实验对比结果表明,该算法在短作业集、混合型作业集、出现节点性能下降的混合型作业集执行时间上比LATE算法分别缩短了5.21%、20.51%、23.86%,启用的备份任务数比LATE算法明显减少。所提算法可使任务主动适应节点差异,在减少备份任务的同时有效提高作业整体执行效率。 朱洁 李雯睿 王江平 赵红关键词:HADOOP 自适应 任务调度 基于MapReduce框架的SQL引擎设计 2016年 近年来,随着计算机网络和数据库技术的发展,对分布式数据库的应用越来越广泛。然而分布式数据库提供的SQL查询引擎的不足:节点扩展性差、加载数据造成整个系统服务的抖动、屏蔽了应用人员直接访问数据接口。针对这种情况,提出一种基于Map Reduce框架的SQL查询引擎,描述了它的架构和设计,它具有扩展性强、容错性较强、性能好、低延时,并提供全面的SQL特性和一些高级操作特性,为高级用户暴露更多数据接口。 杨宁关键词:对数似然比 误比特率 云服务组合的主动自适应技术综述 2017年 为了持续应对复杂、多变的云计算环境,提供满足用户期望的服务,云服务组合除了能实现基本需求外,还必须具备一定程度的自适应能力。介绍了主动自适应技术,研究了云计算环境下服务组合的主动自适应技术、在线质量预测方法和在线调整策略,梳理了云服务组合的主动自适应技术面临的挑战,并提出了应对策略。 李雯睿 潘雷 黄嘉靖 倪紫琦关键词:云计算 实数GA基因层次种群多样性数学模型 被引量:2 2015年 针对现有GA种群多样性定义往往针对二进制编码且存在计算量大、适用性差等问题,建立实数编码基因层次种群多样性数学模型。将实数编码中每一维决策变量的取值范围划分为若干等长度的区间段,并借鉴二进制编码中基因位的含义,定义区间段基因位变量的概念,将其看作随机变量并设计图形化方法,描述每一维变量所有编码值在各等长度取值区间的分布情况,以此刻画种群多样性,通过2个测试函数的优化分析,验证模型的有效性;分析区间段基因位的特性,指出其可以作为复杂非线性优化问题中产生初始群体的先验知识使用,从而可以显著提高寻得最优解的概率及收敛速度;指出今后进一步的研究思路和方向。 赵红 朱杰 朱洁 李雯睿关键词:遗传算法 实数编码 种群多样性 基于Hadoop的三队列作业调度算法 被引量:3 2014年 Hadoop集群单队列作业调度会产生短作业等待、资源利用率低的问题;采用多队列调度可兼顾公平、提高执行效率,但会带来手工配置参数、资源互占、算法复杂等问题。针对上述问题,提出三队列作业调度算法,利用区分作业类型、动态调整作业优先级、配置共享资源池、作业抢占等设计,达到平衡作业需求、简化一般作业调度流程、提升并行执行能力的目的。对短作业占比高,各作业占比均衡以及一般作业为主,偶尔出现长、短作业三种情况与先进先出(FIFO)算法进行了对比实验,结果三队列算法的运行时间均比FIFO算法要少。实验结果表明,在短作业聚集时,三队列算法的执行效率提升并不显著;但当各种作业并存且分布均衡时,效果很明显,这符合了算法设计时短作业优先、一般作业简化流程、兼顾长作业的初衷,提高了作业整体执行效率。 朱洁 赵红 李雯睿关键词:HADOOP 作业调度