您的位置: 专家智库 > >

国家自然科学基金(60633050)

作品数:35 被引量:80H指数:5
相关作者:窦勇窦文华杨学军董亚卓孙全宝更多>>
相关机构:国防科学技术大学河南公安高等专科学校中国航天员科研训练中心更多>>
发文基金:国家自然科学基金国家高技术研究发展计划国防科技技术预先研究基金更多>>
相关领域:自动化与计算机技术电子电信理学更多>>

文献类型

  • 35篇期刊文章
  • 3篇会议论文

领域

  • 35篇自动化与计算...
  • 3篇电子电信
  • 1篇理学

主题

  • 8篇处理器
  • 6篇网络
  • 6篇FPGA
  • 4篇调度
  • 4篇连网
  • 4篇可重构
  • 4篇互连
  • 4篇互连网
  • 4篇互连网络
  • 3篇映射
  • 3篇光突发交换
  • 3篇QOS
  • 2篇多核
  • 2篇多核处理
  • 2篇多核处理器
  • 2篇硬件
  • 2篇体系结构
  • 2篇偏射路由
  • 2篇流水线
  • 2篇路由

机构

  • 32篇国防科学技术...
  • 2篇河南公安高等...
  • 2篇装甲兵工程学...
  • 2篇中国航天员科...
  • 1篇湖南大学
  • 1篇湖南第一师范...
  • 1篇中国人民解放...
  • 1篇并行与分布处...
  • 1篇国防科技大学
  • 1篇中国人民解放...
  • 1篇瑞典皇家理工...
  • 1篇江南遥感应用...

作者

  • 13篇窦勇
  • 6篇杨学军
  • 6篇窦文华
  • 4篇杨灿群
  • 4篇董亚卓
  • 4篇孙全宝
  • 3篇邬贵明
  • 3篇范永亮
  • 3篇肖立权
  • 3篇张民选
  • 2篇董勇
  • 2篇徐进辉
  • 2篇雷元武
  • 2篇易会战
  • 2篇张光胜
  • 2篇宋健
  • 2篇窦强
  • 2篇周兴铭
  • 2篇左艳辉
  • 2篇李东

传媒

  • 12篇计算机工程与...
  • 5篇计算机工程
  • 4篇计算机学报
  • 3篇计算机研究与...
  • 2篇计算机辅助设...
  • 2篇光通信技术
  • 1篇湖南大学学报...
  • 1篇国防科技大学...
  • 1篇中国科学(E...
  • 1篇计算机工程与...
  • 1篇Scienc...
  • 1篇通讯和计算机...
  • 1篇Journa...

年份

  • 3篇2011
  • 3篇2010
  • 13篇2009
  • 15篇2008
  • 4篇2007
35 条 记 录,以下是 1-10
排序方式:
A coarse-grained reconfigurable computing architecture with loop self-pipelining
2009年
Reconfigurable computing tries to achieve the balance between high efficiency of custom computing and flexibility of general-purpose computing. This paper presents the implementation techniques in LEAP,a coarse-grained reconfigurable array,and proposes a speculative execution mechanism for dynamic loop scheduling with the goal of one iteration per cycle and implementation techniques to support decoupling synchronization between the token generator and the collector. This paper also introduces the techniques of exploiting both data dependences of intra-and inter-iteration,with the help of two instructions for special data reuses in the loop-carried dependences. The experimental results show that the number of memory accesses reaches on average 3% of an RISC processor simulator with no memory optimization. In a practical image matching application,LEAP architecture achieves about 34 times of speedup in execution cycles,compared with general-purpose processors.
DOU Yong WU GuiMing XU dinHui ZHOU XingMing
关键词:可重构计算循环调度自流水RISC处理器
位平面编码存储优化算法及FPGA设计被引量:5
2008年
提出一种基于子块的存储优化算法,可用于解决现有JPEG2000位平面编码器中存在的访问编码块存储器模式失配问题.采用将编码块划分成4×4的子块独立进行编码的策略,将访问同一小波系数的时间间隔从3N2Δt减少至48Δt,同时将访问编码块存储器的次数从(3K-2)N2降低至N2/W.该算法不仅兼容现有各种加速技术,而且增加了子块并行的机会.基于FPGA平台实现了一种子块并行合并样本并行的位平面编码器结构,能够将编码时间复杂度从O(N2)降低至O(N),同时节省状态信息存储39%以上.实验结果表明,与目前最快的三层并行结构相比,文中设计的加速比达到了1.3.
李宝峰窦勇
关键词:JPEG2000位平面编码FPGA
基于查表的空间填充曲线映射算法
2010年
空间填充曲线是进行数据降维处理的典型方法。首先给出对角线空间填充曲线的映射规则,该规则使得在高维情况下存在唯一曲线,并且每一维度上的格点数目不受限制。然后提出等势面的概念,推导出不同等势面上格点数量的递推关系。在此基础上,给出基于查表的对角线空间填充曲线映射算法,该算法执行快、可扩展性好,其时间复杂度随维度的增加呈线性增长。
吴国福窦强窦文华
关键词:空间填充曲线对角线等势面降维
二维DCT在粗粒度可重构处理器上的实现被引量:2
2008年
针对粗粒度可重构处理器的特点,提出一种二维离散余弦变换的设计方法,该方法在硬件资源受限的条件下,有效地挖掘了算法的并行性,结果证明算法在速度和资源利用率方面均达到了较好的状态,可满足实时图像编解码的要求。
徐佳庆邬贵明窦勇
关键词:二维离散余弦变换可重构处理器粗粒度
Cell处理器上软件缓存的设计与实现被引量:3
2011年
在Cell异构多核处理器上,并行程序对不规则共享数据的访问延迟较大,共享数据的一致性维护困难。为解决上述问题,提出一种基于扩充Location Consistency存储模型一致性协议的软件缓存。测试结果表明,该软件缓存能够缩短近40%的共享数据访问时间,有效提高并行程序的执行效率。
孙守航杨灿群
关键词:CELL处理器一致性
自相似网络流量预测研究被引量:5
2008年
研究发现,网络流量自相似特性具有普遍性,且不随缓冲、交换、传输和延迟而改变,网络流量预测必须考虑这种自相似特性.本文从自相似网络流量的多个方面对现有研究成果进行了分析,从网络自相似的模型、参数估计、性能预测等多个方面对网络自相似流量预测研究进展进行了总结,并提出了一种基于测量的流量自相似等价带宽预测算法.分析表明:该算法能有效地减少计算量和降低实现复杂度.
张光胜李靖波窦文华邵立松
关键词:网络通信量自相似参数估计
滑动窗口应用循环展开及其数据通路生成被引量:3
2008年
滑动窗口广泛应用于图像处理、模式识别和数字信号处理中,它具有数据量大、计算密集等特点.可重构硬件为滑动窗口应用提供了一个灵活高效的实现平台.文中基于一种存储、数据调度模型及其相应的数据通路生成技术,研究循环展开对滑动窗口应用的面积、时钟频率和吞吐率的影响.实验结果表明内层循环展开相对于外层循环展开将带来更大的控制复杂度,增加了对芯片面积的需求,然而外层循环展开需要更多的存储资源保存重用数据;当片内存储模块个数增加到一定规模时,时钟频率将随着循环展开不断降低;不同维度的应用,吞吐率随循环展开提升程度不同.
董亚卓刘明政夏飞窦勇
关键词:数据通路
片上网络二维和三维结构的通信性能分析被引量:5
2011年
芯片集成技术的迅猛发展,使得片上网络从二维向三维扩展成为可能。研究表明三维片上网络因拓扑维度的增加而缩短了通信距离,极大地提升了网络的平均通信性能。本文对比分析了k-ary-2-mesh网络及其对应的三维网络在最差情形下的通信性能,得出了以下结论:三维网络的平均通信性能虽然更优,但受垂直信道影响其最差情形下的通信性能可能劣于其对应的二维网络。本文的分析基于网络演算理论,该理论广泛应用于计算信息流穿越各种网络元素的延迟上界。
钱悦鲁中海窦强窦文华
关键词:网络演算性能分析
基于简化Trace的动态隐式断言执行被引量:2
2007年
分支指令与分支预测失败限制了处理器发掘指令级并行(ILP)的潜力.通过If-conversion或Predicated执行将程序中的控制相关转化为数据相关,能较好地降低分支预测开销.提出一种基于简化Trace结构的动态隐式断言执行机制(Dynamic Implicit Predication,DIP),而早期的相关研究主要集中于由编译器显式为宽发射处理器产生静态Predicated指令.无需编译器或者其他二进制工具的帮助,DIP可以在程序运行过程中识别可以进行断言变换的指令片断,完成指令转换与优化,并在以后的执行中使用优化后的指令Trace.基于SPEC2000模拟测试表明DIP可以有效避免错误的分支预测,提高并行度,单个程序的IPC平均提高10.3%,基准程序的平均加速比可达7.59%.
唐遇星邓鹍窦勇周兴铭
关键词:指令级并行断言流水线
LBM算法在Cell处理器上的实现和优化
Cell 是一款异构多核的高性能处理器,它包含一个64位 PowerPC 处理器核和8个 SIMD 向量协处理器核心。目前 Cell 处理器主要应用在游戏平台和富媒体消费电子设备上。本文将 SPECfp2006中的浮点基...
赵秋平杨灿群王锋
关键词:科学计算程序
文献传递
共4页<1234>
聚类工具0