您的位置: 专家智库 > >

国家自然科学基金(61003036)

作品数:20 被引量:58H指数:4
相关作者:吴艳霞李静梅张国印郭振华顾国昌更多>>
相关机构:哈尔滨工程大学清华大学黑龙江省计算中心更多>>
发文基金:国家自然科学基金中央高校基本科研业务费专项资金黑龙江省自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 20篇中文期刊文章

领域

  • 20篇自动化与计算...

主题

  • 8篇调度
  • 6篇异构
  • 6篇任务调度
  • 4篇调度算法
  • 4篇多核
  • 4篇异构多核
  • 4篇阵列
  • 4篇现场可编程
  • 4篇现场可编程门...
  • 4篇门阵列
  • 4篇可编程门阵列
  • 3篇多核处理
  • 3篇多核处理器
  • 3篇异构多核处理...
  • 3篇可重构
  • 3篇计算机
  • 3篇处理器
  • 2篇蚁群
  • 2篇蚁群算法
  • 2篇蚁群优化

机构

  • 20篇哈尔滨工程大...
  • 1篇清华大学
  • 1篇黑龙江省计算...

作者

  • 15篇吴艳霞
  • 9篇李静梅
  • 5篇顾国昌
  • 5篇郭振华
  • 5篇张国印
  • 4篇张博为
  • 3篇韩启龙
  • 2篇牛晓霞
  • 2篇王雪
  • 2篇刘书勇
  • 2篇张大虎
  • 2篇孙延腾
  • 1篇朱若平
  • 1篇陆志坚
  • 1篇杨杰
  • 1篇刘正
  • 1篇刘海波
  • 1篇孙霖
  • 1篇林俊宇
  • 1篇杨敏

传媒

  • 4篇计算机工程与...
  • 3篇计算机工程
  • 2篇电子学报
  • 2篇计算机应用研...
  • 2篇计算机工程与...
  • 2篇吉林大学学报...
  • 1篇清华大学学报...
  • 1篇计算机学报
  • 1篇小型微型计算...
  • 1篇计算机科学
  • 1篇智能系统学报

年份

  • 1篇2017
  • 2篇2016
  • 4篇2015
  • 8篇2014
  • 2篇2013
  • 2篇2012
  • 1篇2011
20 条 记 录,以下是 1-10
排序方式:
基于异构CMP的改进蚁群优化任务调度策略被引量:1
2015年
为提高异构CMP任务调度执行效率,充分发挥异构CMP的异构性和并行能力,提出一种基于异构CMP的改进蚁群优化任务调度算法——IACOTS。IACOTS算法首先建立任务调度模型、路径选择规则和信息素更新规则,使蚁群算法能够适用于异构CMP任务调度问题。同时通过采用动态信息素更新、相遇并行搜索策略和引入遗传算法中的变异因子对基本的蚁群算法进行优化,克服蚁群算法搜索时间过长和"早熟"现象。通过仿真实验获得的结果表明,IACOTS算法执行效率优于现有的遗传算法,完成相同的任务需要的迭代次数最少,能有效降低程序执行时间,适用于异构CMP等大规模并行环境的任务调度。
李静梅张大虎吴艳霞
关键词:任务调度蚁群算法
基于LLVM的函数内联优化技术研究
2017年
函数内联(Function Inlining)是使用函数体代替函数调用的一种编译优化技术。LLVM中原生的内联模型只根据函数体的大小来判断函数内联与否,而没有考虑函数的调用次数和后续的优化。针对这个问题,提出了基于函数调用次数(NFC)和考虑后续循环合并(BLF)的新内联模型。首先,通过NFC模型对被多次调用的函数进行内联,进而减少更多因函数调用而产生的额外消耗。其次,通过BLF模型能够识别出进行内联后可以进一步进行循环合并优化的函数,为后续循环合并优化提供支持。实验结果表明,提出的函数内联优化技术是可行的,测试程序平均加速比为1.52%。
郭振华吴艳霞安龙飞张国印卢文祥
关键词:加速比
面向ASCRA的循环流水启动间距自动分析及优化
2015年
在实现循环到流水硬件结构自动映射过程中,迭代间启动间距的自动分析技术是可重构编译器研究的难点.在现有细粒度可重构编译器中,主要采用人工输入制导语句的方法来控制循环并行流水硬件结构自动映射所需启动间距信息的生成,该方法只能采用固定启动间距方式对流水硬件结构进行控制,不能充分发挥并行流水硬件结构的性能,同时人工确定启动间距的方法降低了可重构计算应用的部署效率.针对细粒度可重构编译器的现状,文中提出了一种面向ASCRA的循环流水启动间距自动分析及优化方法.在细粒度可重构编译器中,建立多层循环流水迭代间启动间距分析模型,提出非固定启动间距控制策略,采用自动生成算法得到迭代间启动间距向量信息,并采用流水线调度技术对迭代间启动间距进行优化.实验结果表明,与现有HLS工具相比,文中方法不仅能够提高可重构计算应用在异构加速平台上的部署效率,同时能够有效改善循环应用在FPGA协处理器中流水执行时的性能,具有一定的可行性.
郭振华吴艳霞张国印戴葵
关键词:自动映射
基于异构CMP的静态任务调度研究被引量:1
2014年
现有任务调度算法在选取任务优先级参数时仅仅考虑单一属性,且没有及时处理冗余任务,针对这一问题,提出一种异构CMP中列表与复制优化任务调度算法-HLDOTS算法.该算法首先对任务图中某些特殊的任务进行优化;综合考虑任务的多个属性来为任务分配优先级,构造调度列表;在任务分配阶段,采用基于插入的策略和任务复制技术将当前任务分配到最早执行完成该任务的处理器上;并逐层对调度结果中产生的冗余任务进行处理,将任务分配与冗余任务处理交替进行,避免了冗余任务对处理器资源的浪费,提高了处理器的资源利用率和任务调度效率.采用随机生成图进行模拟实验,实验结果表明,HLDOTS算法较HEFT算法、CPOP算法和HCPFD算法取得了更好的调度性能.
李静梅孙冬微韩启龙
关键词:任务调度
面向可重构编译技术的RAM访问优化算法
2011年
在基于低层虚拟机的四层C-to-VHDL可重构编译架构上,针对RAM访问和设计执行性能之间的矛盾,提出一种RAM读取优化算法。通过对IR访存指令及数据相关性的分析,创建专用数据通路,优化RAM的访存过程。实验结果表明,该优化算法能够有效减少RAM访问次数。
杨敏吴艳霞顾国昌孙延腾
关键词:FPGA设计
一种改进的优先级列表任务调度算法被引量:23
2014年
异构多核处理器任务调度是高性能计算领域的重要问题。针对优先级列表调度算法中存在的优先级排序方法失当、调度结果不理想的问题,提出一种改进的优先级列表任务调度算法。该算法对传统优先级列表任务调度中以任务执行时间平均值作为参数的优先级计算方式进行优化,提出一种基于异构核性能差异性、依赖任务特征加权优先级的排序方式。在此基础上,以当前格局下每个任务的向后关键路径执行时间为权值作为任务分配到处理器内核的依据,克服贪心思想在内核选择中带来的局部最优解问题。此外,在任务分配阶段利用任务复制和区间插入技术,缩短任务最早开始时间,提高处理器利用率。实例分析和模拟实验结果表明,该算法可有效降低任务的执行时间,能发挥异构多核处理器优势。
李静梅王雪吴艳霞
关键词:异构多核任务调度
一种全局较优的静态任务调度算法被引量:4
2014年
针对现有任务调度算法优先级选取过于单一所产生局部较优调度结果的问题,从全局较优出发,提出一种先分层后分支决定优先级的静态任务调度算法—HGCOTS算法。该算法考虑了任务间较大的通信开销和冗余任务对异构CMP任务调度效率的影响,通过综合区间插入和任务复制技术最大限度地降低了任务间的通信开销,对冗余任务进行删除,明显提高了任务调度效率。使用随机生成图进行模拟实验,与其他算法相比,新算法具有更小的调度长度。
李静梅孙冬微吴艳霞
关键词:任务调度调度长度
基于任务复制的多关键路径任务调度算法被引量:6
2014年
高效的任务调度算法使多核处理器的资源分配和并行计算能力更加高效。通过研究关键路径对任务调度算法的重要性后提出TDMCP算法。对DAG上关键任务的确定采用一种多关键路径选取的方法,使得关键路径上信息在任务调度的每一步都是实时更新的;保证调度的每一步优先执行紧迫性高的任务;对首任务采用任务复制技术,使得后续任务的调度更加的高效,从整体上提高任务调度效率。和两个经典任务调度算法进行实验性能的比较,比较结果表明TDMCP算法在任务调度时间和算法执行效率方面都要优于两种经典算法。
李静梅尤晓非韩启龙
关键词:任务调度调度算法
基于动态任务调度的STDS算法设计研究被引量:1
2015年
任务调度是计算机多核处理器系统获得高性能的关键,而现有的多核任务调度算法研究,大多侧重于静态调度下的算法优化和负载均衡,对动态调度及动态负载均衡研究较少。针对动态调度,并结合异构多核的特点,提出一种基于核负载均衡的动态任务调度算法STDS。算法通过合理设定调度粒度,降低调度频率,从而减少调度消耗时间;根据异构多核处理器各核处理性能的差异,设置内核负载上下限值,控制内核负载保持在同一水平,以达到负载均衡效果。算法依据等待时间长短、任务间通信大小和内核负载轻重因素对任务进行实时调度,并可通过实时因子、负载因子等参数设置3种因素的影响比重,以满足系统的不同需求。仿真实验显示,在内核数目较多的系统中,STDS算法更加高效,在保证任务处理速度的同时有较好负载均衡。
刘正
关键词:动态任务调度负载均衡
基于可重构计算系统的矩阵三角化分解硬件并行结构研究被引量:6
2015年
可重构计算系统成为加速计算密集型应用的重要选择之一.在众多受到关注的计算密集型问题中,矩阵三角化分解作为典型的基础类应用始终处于研究的核心地位,在求解线性方程组、求矩阵特征值等科学与工程问题中有重要的研究价值.本文面向矩阵三角化分解中共有的三角化计算过程,通过分析该过程的线性计算规律,提出一种适于硬件并行实现的子矩阵更新同一化算法及矩阵三角化计算FPGA(Field Programmable Gate Array)并行结构.针对LU矩阵三角化分解在并行结构模板上的高性能实现及优化方法开展了研究.理论分析表明,该算法针对矩阵三角化计算过程具有更高的数据并行性与流水并行性;实验结果表明,与通用处理器的软件实现相比,根据该算法实现的矩阵三角化分解FPGA并行结果在关键计算性能上可以取得10倍以上的加速比.
刘书勇吴艳霞张博为张国印戴葵
关键词:LU分解现场可编程门阵列
共2页<12>
聚类工具0