您的位置: 专家智库 > >

刘道福

作品数:14 被引量:13H指数:2
供职机构:中国科学院计算技术研究所更多>>
发文基金:国家自然科学基金中国科学院战略性先导科技专项国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术文化科学更多>>

文献类型

  • 10篇专利
  • 4篇期刊文章

领域

  • 8篇自动化与计算...
  • 2篇文化科学

主题

  • 4篇阵列式
  • 4篇整数
  • 4篇正整数
  • 4篇神经网
  • 4篇神经网络
  • 4篇图像
  • 4篇计数
  • 4篇计数方法
  • 4篇计数装置
  • 4篇传递数据
  • 4篇存取
  • 3篇多核
  • 3篇缓存
  • 3篇功耗
  • 2篇多核处理
  • 2篇多核处理器
  • 2篇硬件
  • 2篇硬件实现
  • 2篇目标检测
  • 2篇可重构

机构

  • 14篇中国科学院
  • 2篇中国科学院研...
  • 2篇中国科学院大...
  • 1篇中国科学技术...
  • 1篇龙芯中科技术...
  • 1篇上海寒武纪信...

作者

  • 14篇刘道福
  • 13篇陈云霁
  • 10篇陈天石
  • 8篇郭崎
  • 1篇李玲
  • 1篇钱诚
  • 1篇郭琦
  • 1篇王磊

传媒

  • 3篇高技术通讯
  • 1篇计算机研究与...

年份

  • 1篇2021
  • 1篇2020
  • 3篇2019
  • 4篇2018
  • 1篇2017
  • 1篇2016
  • 1篇2015
  • 1篇2013
  • 1篇2011
14 条 记 录,以下是 1-10
排序方式:
可重构的S型运算装置及运算方法
本公开提供一种可重构的S形运算装置和方法,其中装置包括:运算部分,用于完成运算,包含多个运算单元组,多个所述运算单元组呈X行Y列的阵列式分布,运算单元组间以S形方向和/或逆S形方向传递数据,其中X和Y分别为正整数。通过采...
周聖元陈云霁陈天石刘少礼郭崎杜子东刘道福
计数方法及装置
本公开提供了一种计数方法,包括:对一深度神经网络进行预训练;利用标记图像对预训练后的所述深度神经网络进行重训练,得到二分类的目标检测神经网络;以及利用所述二分类的目标检测神经网络对待计数的图像中包含的计数目标物体进行计数...
于涌陈云霁陈天石刘少礼郭崎杜子东刘道福
文献传递
硬件实现的数据排序装置、方法及数据处理芯片
本发明提供一种功耗低、面积小、结构简单、效率高的可应用于加速器中的硬件实现的数据排序装置、方法及包括该数据排序装置的数据处理芯片,所述数据排序装置包括:寄存器组,保存数据排序过程中暂时排出的K个最大或最小的数据,寄存器组...
刘道福周圣元陈云霁
计数方法及装置
本公开提供了一种计数方法,包括:对一FAST R‑CNN或YOLO深度神经网络进行训练;以及利用训练后的FAST R‑CNN或YOLO深度神经网络对待计数的图像中包含的计数目标物体进行计数。本公开还提供了一种计数装置。本...
于涌陈云霁陈天石刘少礼郭崎杜子东刘道福
可重构的S型运算装置及运算方法
本公开提供一种可重构的S形运算装置和方法,其中装置包括:运算部分,用于完成运算,包含多个运算单元组,多个所述运算单元组呈X行Y列的阵列式分布,运算单元组间以S形方向和/或逆S形方向传递数据,其中X和Y分别为正整数。通过采...
周聖元陈云霁陈天石刘少礼郭崎杜子东刘道福
文献传递
多核处理器片上网络trace压缩方法被引量:2
2011年
针对多核处理器的硅后调试和验证的困难,研究了克服这一困难的重要手段——对处理器片上网络(NOC)的trace信号的抓取。由于片上网络的trace数量庞大,为满足片上存储资源和trace实时导出带宽的限制,需要对trace进行压缩处理。和传统的单核或片上系统(SOC)平台不同,多核处理器的应用复杂,因而片上网络trace噪音大,分布复杂,用传统的trace压缩算法不易取得高的压缩率。针对上述特点,提出了一种多核处理器的片上网络trace的压缩方法。该方法对地址信息采用动态提取平稳数据块的方法进行分别压缩,对时间信息采用多粒度和Huffman编码结合来精确压缩,满足了多核处理器调试的需要。相比于传统的压缩算法,该方法更有针对性。多核通用处理器的片上网络trace的压缩实验表明,该方法的压缩率比已有方法高6倍。
钱诚刘道福陈云霁
关键词:TRACE多核处理器
神经网络运算装置及应用其进行运算的方法
本公开提供一种神经网络运算装置和方法,其中装置包括:运算部分,用于完成所述卷积运算,包含多个运算单元组,多个所述运算单元组呈X行Y列的阵列式分布,运算单元组间以S形方向和/或逆S形方向传递数据,其中X和Y分别为正整数;缓...
周聖元陈云霁陈天石刘少礼郭崎杜子东刘道福
文献传递
片上多核处理器共享资源分配与调度策略研究综述被引量:9
2013年
对于片上多核处理器,如何在多线程间公平有效地分配调度有限的共享资源是一个很重要的问题.随着处理器核规模的增长,多线程对于系统中有限的共享资源的争夺将愈发激烈,由此导致的对于系统性能的影响也将更加显著.为了缓解乃至解决这一问题,除了增加可用共享资源外,一个能够公平有效地在多线程间分配共享资源的调度算法也至关重要.在各类共享资源中,对于系统性能有着最大影响的是共享缓存和动态随机存储器(dynamic random-access memory,DRAM)系统.对于共享缓存,可以通过缓存分区来降低由于线程间的争夺所带来的影响;对于DRAM系统,可以采取适当的调度算法来调节各个线程发出的访存请求的服务优先级,从而改善系统性能.首先分别以系统吞吐量和公平性为优化目标介绍了一系列对共享缓存的分区调度算法,并针对缓存分区粒度过大的问题给出了相关解决方案.然后从利用线程的访存行为特征和借鉴网络路由算法等多个角度介绍了DRAM的调度算法.研究了从全局出发的联合调度算法,以解决针对不同共享资源的调度算法间相互矛盾的问题.最后从不同角度对于今后的研究进行了展望.
王磊刘道福刘道福陈云霁陈天石
关键词:片上多核处理器多线程共享缓存
计数方法及装置
本公开提供了一种计数方法,包括:对一深度神经网络进行预训练;利用标记图像对预训练后的所述深度神经网络进行重训练,得到二分类的目标检测神经网络;以及利用所述二分类的目标检测神经网络对待计数的图像中包含的计数目标物体进行计数...
于涌陈云霁陈天石刘少礼郭崎杜子东刘道福
计数方法及装置
本公开提供了一种计数方法,包括:对一FAST R‑CNN或YOLO深度神经网络进行训练;以及利用训练后的FAST R‑CNN或YOLO深度神经网络对待计数的图像中包含的计数目标物体进行计数。本公开还提供了一种计数装置。本...
于涌陈云霁陈天石刘少礼郭崎杜子东刘道福
文献传递
共2页<12>
聚类工具0