您的位置: 专家智库 > >

沈莉

作品数:69 被引量:3H指数:1
供职机构:江南计算技术研究所更多>>
发文基金:国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 65篇专利
  • 2篇期刊文章
  • 2篇会议论文

领域

  • 29篇自动化与计算...

主题

  • 31篇异构
  • 26篇代码
  • 22篇编译器
  • 17篇链接
  • 15篇处理器
  • 13篇异构平台
  • 12篇链接器
  • 11篇内存
  • 11篇函数
  • 9篇线程
  • 8篇硬件
  • 8篇存储器
  • 7篇动态链接
  • 7篇向量
  • 6篇用户
  • 6篇用户程序
  • 6篇片上存储器
  • 6篇重定位
  • 6篇自适
  • 6篇自适应

机构

  • 69篇江南计算技术...
  • 2篇郑州大学
  • 2篇中国科学技术...

作者

  • 69篇沈莉
  • 55篇王飞
  • 44篇肖谦
  • 32篇钱宏
  • 32篇管茂林
  • 31篇吴伟
  • 11篇漆锋滨
  • 10篇尉红梅
  • 8篇李中升
  • 6篇吴佩华
  • 4篇胡浩
  • 3篇姜军
  • 2篇龚传
  • 2篇周清雷
  • 2篇王超
  • 1篇陈林
  • 1篇何王全

传媒

  • 1篇计算机应用与...
  • 1篇计算机科学
  • 1篇2006年全...

年份

  • 28篇2022
  • 25篇2021
  • 1篇2020
  • 1篇2019
  • 2篇2018
  • 3篇2016
  • 2篇2015
  • 1篇2014
  • 2篇2013
  • 2篇2012
  • 1篇2010
  • 1篇2006
69 条 记 录,以下是 1-10
排序方式:
一种基于国产异构平台的C++向量编程方法
本发明公开一种基于国产异构平台的C++向量编程方法,所述编程方法包括以下步骤:S1、通过引入头文件simd.h的形式获得向量数据类型和向量编程接口的支持;S2、编译器对C++向量程序进行前端处理,生成中间表示代码;S3、...
武文浩王飞肖谦沈莉周文浩
面向容量受限的程序栈空间深度追溯方法
本发明公开一种面向容量受限的程序栈空间深度追溯方法,包括以下步骤:S1、在链接器中建立函数信息的数据结构,形成函数调用关系流程图;S2、获取所有的函数符号信息,建立相应的函数信息数据结构,并将函数的名称、PC值范围、自身...
肖谦王飞尉红梅沈莉钱宏管茂林朱琪周文浩
文献传递
基于编译实现的可扩展向量掩码功能的方法和装置
本发明公开一种基于编译实现的可扩展向量掩码功能的方法和装置,包括以下步骤:S1、编译器输入用户程序,根据目标平台翻译出正确的掩码向量接口;S2、编译器前端模块对S1中获得的掩码向量接口进行关键字识别,选择对应平台的中端处...
沈莉王飞钱宏管茂林朱琪吴伟肖谦武文浩
一种异构代码融合的编译和生成方法
本发明提供了一种异构代码融合的编译和生成方法,包括:利用运算控制核心编译器和运算核心编译器分别为运算控制核心和运算核心生成第一对象文件和第二对象文件;运算核心编译器自动实现对第一对象文件中的函数的重命名,在函数名的前加上...
王飞尉红梅沈莉管茂林漆锋滨
深度学习框架编译器宽度非一致自动向量优化方法
本发明公开一种深度学习框架编译器宽度非一致自动向量优化方法,基于异构平台,包括以下步骤:S1、框架编译器前端识别计算图中可进行向量优化的子图,S2、框架编译器中端对步骤S15标记的可进行向量优化的子图中的算子进行融合,并...
沈莉周文浩王飞武文浩肖谦
面向异构众核后端基于代价模型的多面体优化方法
本发明公开一种面向异构众核后端基于代价模型的多面体优化方法,包括以下步骤:S1、编译器解析位于主核和从核上的用户程序的编译标识,生成对应的主核中间表示和从核中间表示;S2、编译器对S1中生成的主核和从核的中间表示层代码进...
漆锋滨周文浩沈莉肖谦黄驻峰管茂林
文献传递
一种基于异构众核架构的直接内存访问编译优化方法
本发明公开一种基于异构众核架构的直接内存访问编译优化方法,包括以下步骤:S1、通过调度原语cache_read,将张量数据由主存搬移到局存;S2、通过调度原语pragma,将S11中的数据搬移操作改写为DMA GET操作...
周文浩王飞沈莉肖谦武文浩李斌赵美佳
基于LLVM编译器的节点融合优化方法被引量:3
2020年
LLVM是以C++编写的架构编译器的框架系统,支持多后端和交叉编译,用于优化程序的编译时间、链接时间、运行时间和空闲时间。节点融合是一种简单有效的优化方法,其基本思想为将多个节点优化为一个高效的融合节点,减少诸如指令、寄存器、时钟周期和访存等开销,以达到减少程序运行时间,提升访存效率等目的。为了提升LLVM编译器的性能,文中在LLVM编译流程的中间表示阶段和DAG合并阶段、指令选择阶段提出了节点融合优化方法。在国产平台申威处理器下,以CLANG和FLANG为编译器前端,LLVM为编译器后端,基于SPEC CPU2006测试集进行了评估,实验结果表明,节点融合优化有利于提高编译器性能和减少程序运行时间,优化后最大加速比为1.59,平均加速比为1.13。
胡浩沈莉沈莉周清雷
关键词:LLVM
基于C代码生成的神经网络模型推理和训练方法
本发明公开一种基于C代码生成的神经网络模型推理和训练方法,包括以下步骤:S1、以通过各种AI编程框架开发的模型作为输入,AI框架编译器识别各种模型格式并转化为统一的计算图,将输入的模型转化为底层IR;S2、将S1中生成的...
肖谦周文浩钱宏沈莉管茂林武文浩朱琪吴伟
一种程序调试方法及系统
本发明公开了一种程序调试方法及系统,能够将针对尚未研制成功的CPU芯片的程序转换为针对已研制成功并可靠性高的CPU芯片体系结构上的程序,并使用标准的调试器进行调试,对程序的正确性和性能进行分析和评估,从而避免了使用体系结...
尉红梅王飞李中升吴佩华沈莉龚传
文献传递
共7页<1234567>
聚类工具0