您的位置: 专家智库 > >

唐勇

作品数:50 被引量:4H指数:2
供职机构:江南计算技术研究所更多>>
发文基金:国家科技重大专项更多>>
相关领域:自动化与计算机技术文化科学电子电信更多>>

文献类型

  • 47篇专利
  • 2篇期刊文章
  • 1篇会议论文

领域

  • 28篇自动化与计算...
  • 1篇电子电信
  • 1篇文化科学

主题

  • 25篇处理器
  • 9篇计算机
  • 8篇阵列
  • 8篇体系结构
  • 8篇主存
  • 7篇寄存器
  • 7篇计算机体系
  • 7篇计算机体系结...
  • 6篇脉动阵
  • 6篇脉动阵列
  • 6篇加载
  • 5篇条目
  • 5篇矩阵
  • 5篇矩阵乘
  • 4篇队列
  • 4篇多核
  • 4篇数据传输
  • 4篇私有
  • 4篇卸载
  • 4篇乱序

机构

  • 50篇江南计算技术...

作者

  • 50篇唐勇
  • 18篇郑方
  • 17篇高红光
  • 16篇李宏亮
  • 14篇过锋
  • 12篇许勇
  • 11篇施晶晶
  • 10篇杨萱
  • 10篇任秀江
  • 10篇郝子宇
  • 8篇张清波
  • 8篇高剑刚
  • 7篇陈芳园
  • 6篇谢向辉
  • 6篇刘骁
  • 5篇张昆
  • 5篇丁亚军
  • 5篇刘亮
  • 4篇谢军
  • 4篇刘杰

传媒

  • 1篇计算机学报
  • 1篇中国科学:信...
  • 1篇2008年全...

年份

  • 16篇2022
  • 3篇2021
  • 7篇2020
  • 2篇2019
  • 2篇2016
  • 4篇2015
  • 3篇2014
  • 7篇2013
  • 5篇2012
  • 1篇2008
50 条 记 录,以下是 1-10
排序方式:
一种基于并行循环压缩的余数运算电路及方法
本发明属于计算机整数乘法校验设计技术领域,特别涉及一种基于并行压缩循环的余数运算电路及方法。包括多个输入端,分别用于输入多个同位宽的二进制数;模加法器,用于输出求余结果;一层或多层进位保留加法器组件,设置在多个输入端和模...
高剑刚刘骁赵冠一张昆唐勇谢军朱巍王之辰
文献传递
向量查表方法以及处理器
一种向量查表方法以及处理器。第一多次查表指令字段用于标示向量查表操作,第二、第三多次查表指令字段为源操作数寄存器的索引号,第四多次查表指令字段为目标寄存器的索引号。第二多次查表指令字段指定的寄存器内容为查询基地址,第三多...
高红光丁亚军过锋郑方唐勇任秀江陈彦庭
文献传递
一种支持数据在线重组的DMA访存方法及装置
本发明公开了一种支持数据在线重组的DMA访存方法及装置,涉及数据处理技术领域,包括:DMA引擎收到DMA传输指令时,判断DMA传输指令中是否有数据重组指示,若是则获取数据传输方向以及数据重组参数信息;DMA引擎将收到的D...
张清波施晶晶刘骁唐勇杨萱郝子宇
共享指令缓存XOR散列索引的研究与设计被引量:2
2019年
SPMD(Single Program Multiple Data)是高性能领域的主要工作模式之一,该模式下邻近核心执行相同的程序块,但根据处理数据或控制流的差异,临近核心的指令流并不完全相同.L1 ICache(Instruction Cache)共享技术通过将邻近核心的L1 ICache共享,能有效利用众核处理器SPMD工作模式的特点,同时能缓解片上资源紧张的问题.但共享结构会带来访问冲突,对性能有不利影响.本文基于排队网络对共享ICache的访问冲突进行了理论分析,该理论分析依据核心对共享ICache体的访问特性进行建模,避免了直接抽象物理节点导致的模型访存特性模糊问题.根据理论推导的指令缓存性能损失原因,本文设计了面向共享L1 ICache的低访问冲突XOR散列函数.函数的设计综合考虑搜索了代价和工程实现复杂性,在保证散列线性空间随机散列能力的前提下,对附加延迟、功耗开销进行控制.该散列函数基于异或操作,通过调整ICache排队网络模型的节点转换概率,降低了共享L1 ICache的访问冲突.实验结果表明,在指令缓存总容量为32 KB的四核心簇上,使用XOR散列的共享L1 ICache结构较私有L1 ICache结构性能平均优化11%,较使用低位交错策略的共享L1 ICache结构性能平均优化8%,较使用面向跨步访存散列策略的共享L1 ICache结构性能平均优化3.2%.
刘骁唐勇郑方丁亚军
多核处理器的数据管理方法及装置
一种多核处理器的数据管理方法及装置,所述多核处理器包括处理器核心阵列和处理器核心互连结构,所述处理器核心阵列包括多个处理器核心,所述处理器核心包括具有多个存储单元的核内存储器,所述处理器核心互连结构用于所述处理器核心阵列...
李宏亮郑方谢向辉郝子宇胡苏太唐勇
一种适用于多核心处理器的TLB配置方式
本发明涉及计算机数据计算领域,具体涉及处理器对虚拟内存读取过程中的优化方式。本发明是通过以下技术方案得以实现的:一种适用于多核心处理器的TLB配置方式,包含如下步骤:S01、TLB布置步骤;将所述TLB安装在访存通路的公...
王谛唐勇张清波陈庆强刘骁施晶晶
高速存储区的访问方法以及访问装置
一种高速存储区的访问方法及访问装置,其中所述访问方法包括:在处理器核心请求访问主存时,基于所述Cache数据在主存首地址、Cache行数据量、Cache行条目总数和Cache行有效位判断请求主存地址是否命中Cache;若...
高剑刚许勇唐勇李媛张清波郑方高红光
文献传递
面向众核处理器访存和片内通信的数据传输方法与装置
本发明提供面向众核处理器访存和片内通信的数据传输方法与装置,属于计算机体系结构与处理器微结构领域。该面向众核处理器访存和片内通信的数据传输方法与装置包括如下步骤:S1:通道指令缓冲单元获取1或多个源核心处理器发出的通道指...
高剑刚施晶晶唐勇谢军张清波陈芳园陈庆强过锋
文献传递
基于轻量级消息和共享局部存储器的协同计算系统及方法
本发明属于高性能微处理器领域,涉及基于轻量级消息和共享局部存储器的协同计算系统及方法。包括:S1主核心执行核心算法;S2判断是否执行到加速计算部分,若否则返回步骤S1,若是则执行步骤S3;S3主核心继续执行程序中的核心算...
高剑刚过锋唐勇吴铁彬高红光谭弘兵
指令处理装置和处理器、指令翻译装置和方法
一种指令处理装置和处理器、指令翻译装置和方法,所述指令处理装置用于处理目标指令,所述目标指令由二进制码表示,用于求逻辑表达式的运算结果,所述目标指令包括所述逻辑表达式的真值表中逻辑表达式的值和操作数,以及目标操作数,所述...
谢向辉过锋吴新军李宏亮唐勇任秀江陆晓亮
文献传递
共5页<12345>
聚类工具0