国家高技术研究发展计划(2005AA1Z1271) 作品数:11 被引量:11 H指数:2 相关作者: 严晓浪 彭剑英 李德贤 任坤 孙玲玲 更多>> 相关机构: 浙江大学 杭州电子科技大学 更多>> 发文基金: 国家高技术研究发展计划 更多>> 相关领域: 自动化与计算机技术 电子电信 更多>>
ASIP编译器设计和实现 被引量:1 2009年 为了满足ASIP存储器约束和代码执行的实时性要求,提出一种同时考虑代码选择和寄存器分配的代码综合生成算法,同步处理代码生成的子问题。提出一种能描述ASIP寄存器复杂约束关系的数学模型;改进了传统的图染色算法,将寄存器分配问题转化为对有向数据相关图的简化问题。应用算法构造了一个编译器后端,测试表明,和传统的分步优化算法相比,降低了目标代码的空间尺寸,减少了寄存器溢出的几率。 任坤 严晓浪 孙玲玲关键词:代码生成 一种面向应用优化的片上总线调度策略 被引量:2 2009年 该文提出了一种面向应用优化的片上总线调度策略。以系统通信事件信息为基础,使用最小任务松弛时间与最小总线空闲时间相结合的调度策略,在优先保证满足任务实时要求的基础上,最大限度利用总线空闲时间,提高调度效率。并提供了可配置的权重参数α用于总线时间消耗与片上缓冲区容量之间的设计折衷。在双核SoC平台上实现了本文调度方法,并以最新视频编解码标准H.264/AVC为目标应用,与FP(Fixed Priority),SBA(Slack Based Arbitration),RR(Round Robin)等调度方法进行了性能对比。实验结果表明,α=0.5时,较以上3种策略,分别平均可减少16.6%、13.2%与9.7%的总线时间,在实时性能方面,较最接近的SBA方法,未实时完成的任务数量减少了59.4%。额外缓冲区开销随α的变化关系表明,在最坏情况下(α=0)仅需435字节。 李德贤 彭剑英 严晓浪关键词:片上系统 基于数据流图的专用指令生成方法 被引量:3 2009年 提出了一种基于数据流图(DFG)的专用指令生成方法.以目标应用的高级语言参考代码为起点,通过编译器前端转化为三地址中间格式,得到有向数据流图.使用提出的基于处理器体系架构约束的静态搜索算法对得到的数据流图进行搜索,得到满足约束的操作组合.结合典型测试序列的动态运行数据对搜索结果进行进一步的筛选,确定对于目标应用性能起关键作用的操作组合,以此作为专用加速指令.该方法实现了数据流图提取的自动化,并结合了静态数据流图搜索与动态结果筛选.通过在视频压缩专用处理器设计中的应用,证明此方法可以快速高效地进行专用指令的自动生成. 李德贤 严晓浪 彭剑英关键词:专用指令集处理器 数据流图 基于改进图染色算法的ASIP寄存器分配器 被引量:2 2010年 针对传统的图染色算法很难为不规则结构的专用指令处理器(ASIP)生成优化代码的问题,提出一种能描述ASIP寄存器复杂约束关系的数学模型;改进了传统图染色算法,通过生命周期分析,将各种分配约束限制在一张有向数据相关图中,将寄存器分配问题转化为对有向数据相关图的简化问题;应用改进图染色算法构造了一个ASIP编译器.测试表明:和传统的图染色算法相比,改进图染色算法能充分地考虑寄存器之间的相互约束,降低了目标代码的空间尺寸,减少了寄存器的溢出. 任坤 严晓浪 孙玲玲 翁延玲关键词:寄存器分配 面向视频处理的高效二维流存储系统 被引量:1 2008年 为了解决高度并行的视频处理中存储系统的瓶颈问题,设计了一种高效的基于流的二维存储系统.该系统完成了二维逻辑空间到物理上多路并行存储器模块的映射.在二维逻辑空间中的每一个数据阵列都可以根据给出的基地址、二维偏移量、长度、数据粒度来进行灵活的流访问.数据在物理存储器上进行了交织存放以支持行阵列和列阵列的同时访问.该交织算法在之前的交织算法基础上做了面向流访问的改进.实验结果表明,在实时视频处理中,所述的二维流存储系统可以减少平均约32.0%的存储器访问率,以及25.4%的实时处理所需要的时钟周期数. 刘纯悦 葛海通 严晓浪关键词:视频处理 一种异构双核系统芯片平台设计与实现 2009年 提出了一种基于CKCore RISC处理器和Spock DSP处理器的异构双核系统芯片平台(GEM-SoC)。该平台通过提供可配的功能IP模块和灵活完善的软硬件架构,使得异构双核SoC设计更为准确高效。实验证明,GEM-SoC平台可以有效地加快Ogg解码应用的双核软件程序设计开发。原型芯片在37.68 MHz时钟频率时运行,即可实现实时Ogg音频解码播放,具有较好的功耗性能比。 黄凯 阳晔 葛海通 严晓浪关键词:数字信号处理器 基于域划分的嵌入式处理器代码压缩方法 2008年 为了提高基于域划分的代码压缩方法的压缩率,在传统的位置模型的基础上,挖掘了不同类型指令内部符号间的相关性,提出了一种新的相关模型——类型模型.综合位置模型和类型模型,进一步得到另一种相关模型——混合模型.提出了一种使用混合模型,采用霍夫曼编码的代码压缩方法以及相应的低开销硬件解压缩实现方案.以自主研发的16位嵌入式数字信号处理器(DSP)SPOCK指令集为例,对OggVorbis测试压缩性能.实验结果表明,使用混合模型在少量硬件代价下对SPOCK指令集的压缩率达到53.16%,比传统的位置模型方法提高了12%~14%. 阳晔 刘坤杰 杨军 葛海通 严晓浪关键词:嵌入式处理器 代码压缩 霍夫曼编码 一个新型ASIP编译器的设计和实现 被引量:1 2008年 为了满足专用指令处理器(ASIP)存储器约束和代码执行的实时性要求,提出了一种同时考虑代码选择和寄存器分配的代码综合生成算法,同步处理代码生成的子问题.该算法基于最优化原理,把无环有向图(DAG)的所有节点构造成一个调度矩阵,把寻找代码优化的问题转化成在调度DAG中寻找一条优化路径,大大降低了算法的时间复杂度.并应用算法构造了一个编译器后端,测试表明,该算法能够正确地生成目标代码,和传统的分步优化算法相比,减小了目标代码的空间尺寸,降低了寄存器溢出的几率. 任坤 严晓浪 秦兴 孙玲玲关键词:代码生成 动态规划 EDO-SIMD:内嵌数据组织的SIMD多媒体扩展指令集 2008年 针对单指令多数据(SIMD)并行多媒体扩展在图像和视频等媒体应用中数据组织和存取等非有效计算开销过大的问题,采用嵌入式处理器面向应用定制指令集的设计思路,通过将数据组织与计算或存取相融合,设计了内嵌数据组织和可变长向量存取两类特殊扩展指令,并与其他基本指令构成了EDO-SIMD(embedded data organi-zation SIMD)多媒体扩展指令集.性能测试结果表明,EDO-SIMD指令体系可显著降低典型媒体应用核心的非有效计算开销,并提高数据级并行效率. 刘坤杰 秦兴 严晓浪 李德贤 彭剑英关键词:多媒体处理 单指令多数据 新型时延可控时钟网络驱动器及其应用 被引量:1 2008年 传统的时钟偏差调整方法在应用于超深亚微米工艺时,由于流程各阶段时序一致性的降低会产生失效问题.为此,提出了一种可重构的时延可控时钟网络驱动器(DCCB)的物理设计.该设计可以通过内部结构的重新配置来改变CMOS管的连接方式、连接级数以及各级的驱动能力,从而获得不同的传输延时.利用此特性,基于电路版图时序分析,通过重构DCCB单元进行时钟偏差调整,优化时钟周期.实验结果表明,与传统方法相比,此方法对时钟周期的缩减比例提高了10%~17%,而芯片面积及功耗保持不变. 吕冬明 张培勇 严晓浪 郑丹丹 何仙娥关键词:时钟树