许牧
- 作品数:12 被引量:4H指数:1
- 供职机构:中国科学技术大学更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术自然科学总论更多>>
- 一种在FCMP上支持系统级资源分配和任务调度的方法及装置
- 本发明公开了一种在FCMP上支持系统级资源分配和任务调度的方法及装置,包括:向上层软件提供一组具有统一接口的原语;调用返回暂停原语,暂停FCMP上当前运行逻辑核,向上层软件返回逻辑核的标识号和粒度;调用与任务调度相关的原...
- 安虹孙涛任永青毛梦捷刘杨李颀邓春华许牧
- 一种类数据流驱动的可重构众核流处理器设计被引量:1
- 2013年
- 传统的片上多核结构存在着计算资源粒度固定的缺点,无法满足应用在不同阶段对计算资源的差异化需求.针对上述问题,本文设计了运行时逻辑核可调整的可重构众核流处理器及流程序映射方案,以期满足应用各个阶段对计算资源的需求,且不造成资源浪费.通过在时钟精确软件模拟器上评估不同类型应用的性能表现,分析了处理器主要设计参数对性能的影响.实验结果表明,与具有同样计算资源的固定粒度流处理器相比,本文设计的可重构众核流处理器能够获得10%-30%的性能提升.
- 许牧安虹汤旭龙周伟
- 关键词:可重构流编程模型
- 超长指令字程序的二进制翻译方法
- 本发明的实施例提出了一种超长指令字程序的二进制翻译方法,包括以下步骤:对程序中的超长指令字进行指令解码;还原所述程序中的控制流图以及数据流图;重建类数据流计算模型下的控制流图与数据流图;对所述程序进行超长指令字程序的二进...
- 安虹刘谷徐光许牧李小强韩文廷张倩刘玉
- 文献传递
- 可重构众核流处理器体系结构关键技术研究
- 半导体工艺发展进入深亚微米工艺时代后,传统的多核处理器设计面临着功耗、线延迟和可扩展性等诸多问题,制约了传统多核结构处理器性能的提升。另一方面,应用程序运行时对资源的需求呈现差异性和阶段性的特征,固定粒度的处理器设计难以...
- 许牧
- 关键词:可重构技术流处理器
- 一种单指令多数据流结构上的数据处理方法及处理器
- 本发明公开了一种SIMD上的数据处理方法及处理器,包括:选取符合条件的处理多组数据流,指令具有包括标记位和索引位的谓词域;将指令进行译码,并获取标记位和索引位的值;利用标记位的值判断指令是否为谓词指令;当指令为谓词指令时...
- 安虹许牧徐光刘谷李颀任永青李小强孙涛郝秀蕊周伟谭旭
- 文献传递
- 超长指令字程序的二进制翻译方法
- 本发明的实施例提出了一种超长指令字程序的二进制翻译方法,包括以下步骤:对程序中的超长指令字进行指令解码;还原所述程序中的控制流图以及数据流图;重建类数据流计算模型下的控制流图与数据流图;对所述程序进行超长指令字程序的二进...
- 安虹刘谷徐光许牧李小强韩文廷张倩刘玉
- 面向应用的流存储系统评测与改进
- 2010年
- 有限的片外存储带宽是制约流处理器性能提升的瓶颈之一,流存储系统已经采用了多种方式来缓解这个问题,但当前的设计并没有充分考虑应用具体的访存模式对有效带宽利用率的影响.通过分析和实验,评估流存储系统主要设计参数对不同访存模式的优化效果;在此基础上针对不同的流访问并行度提出了相应的结构改进,加入宽发射和短作业优先调度支持,充分挖掘存储访问的局部性和并行性,改善了负载平衡,从而有效地提高了片外带宽的使用效率和流程序的整体性能.
- 汪芳安虹徐光许牧姚平
- 关键词:DRAM
- 一种单指令多数据流结构上的数据处理方法及处理器
- 本发明公开了一种SIMD上的数据处理方法及处理器,包括:选取符合条件的处理多组数据流,指令具有包括标记位和索引位的谓词域;将指令进行译码,并获取标记位和索引位的值;利用标记位的值判断指令是否为谓词指令;当指令为谓词指令时...
- 安虹许牧徐光刘谷李颀任永青李小强孙涛郝秀蕊周伟谭旭
- 基于主辅数据结构的CPU-GPU合作计算方法
- 本发明的实施例提出了一种基于主辅数据结构的CPU-GPU合作计算方法,包括以下步骤:根据处理的对象,确定主辅数据内容并进行初始化;启动CPU计算线程和GPU计算线程;读入待处理的数据,经过预处理后存储至主辅数据结构中,同...
- 安虹姚平刘谷徐光许牧李小强韩文廷张倩徐恒阳
- 文献传递
- 一种在FCMP上支持系统级资源分配和任务调度的方法及装置
- 本发明公开了一种在FCMP上支持系统级资源分配和任务调度的方法及装置,包括:向上层软件提供一组具有统一接口的原语;调用返回暂停原语,暂停FCMP上当前运行逻辑核,向上层软件返回逻辑核的标识号和粒度;调用与任务调度相关的原...
- 安虹孙涛任永青毛梦捷刘杨李颀邓春华许牧
- 文献传递