2024年11月30日
星期六
|
欢迎来到维普•公共文化服务平台
登录
|
进入后台
[
APP下载]
[
APP下载]
扫一扫,既下载
全民阅读
职业技能
专家智库
参考咨询
您的位置:
专家智库
>
>
张先轶
作品数:
15
被引量:21
H指数:2
供职机构:
中国科学院软件研究所
更多>>
发文基金:
国家自然科学基金
国家高技术研究发展计划
国家重大技术装备创新研制项目
更多>>
相关领域:
自动化与计算机技术
理学
更多>>
合作作者
张云泉
中国科学院软件研究所
王茜
中国科学院软件研究所
张常有
中国科学院软件研究所
刘芳芳
中国科学院软件研究所
胡泽林
中国科学院软件研究所
作品列表
供职机构
相关作者
所获基金
研究领域
题名
作者
机构
关键词
文摘
任意字段
作者
题名
机构
关键词
文摘
任意字段
在结果中检索
文献类型
6篇
专利
5篇
期刊文章
4篇
会议论文
领域
8篇
自动化与计算...
1篇
理学
主题
3篇
矩阵
3篇
矩阵乘
2篇
代码
2篇
代码生成
2篇
代码生成工具
2篇
队列
2篇
行扫描
2篇
性能分析
2篇
语言
2篇
云服务
2篇
质谱
2篇
色谱
2篇
色谱峰
2篇
数据存储
2篇
数据存储方法
2篇
数据局部性
2篇
索引
2篇
体系结构
2篇
谱峰
2篇
自动生成
机构
15篇
中国科学院软...
6篇
中国科学院研...
1篇
石家庄铁道大...
作者
15篇
张先轶
10篇
张云泉
5篇
王茜
4篇
张常有
3篇
刘芳芳
2篇
王婷
2篇
胡泽林
2篇
段淑凤
2篇
刘仁芬
1篇
李玉成
1篇
王靖
1篇
王靖
1篇
袁良
1篇
王磊
1篇
陈家杰
1篇
李会元
1篇
程豪
1篇
王磊
传媒
2篇
计算机工程
1篇
计算机工程与...
1篇
数值计算与计...
1篇
计算机科学
1篇
2009年全...
年份
1篇
2017
1篇
2016
2篇
2015
1篇
2014
2篇
2013
2篇
2012
1篇
2011
3篇
2010
2篇
2009
共
15
条 记 录,以下是 1-10
全选
清除
导出
排序方式:
相关度排序
被引量排序
时效排序
一种稀疏矩阵的存储方法CSRL及基于该方法的SpMV实现方法
本发明公开一种稀疏矩阵的存储方法CSRL及SpMV实现方法,按行扫描稀疏矩阵A,用数组val顺序存储每个非零元值信息;定义列下标连续的若干个非零元为一个连续非零元段,用数组jas记录每个连续非零元段的第一个元素的列下标,...
刘芳芳
张云泉
张先轶
王茜
文献传递
一种面向高性能计算的云服务消息传递方法
一种面向高性能计算的云服务消息传递方法,步骤:定义消息模板;消息产生:根据消息模板,把消息内容和相关资源打包或编号,生成消息对象实例;消息入列:从云服务平台中的消息生产方把消息对象实例装入指定消息服务系统中的指定消息队列...
张常有
刘仁芬
段淑凤
张先轶
王婷
文献传递
六边形区域快速傅里叶变换的CUDA-MPI算法及其实现
被引量:4
2012年
本文研究六边形区域上快速傅里叶变换(FFTH)的CUDA—MPI算法及其实现.首先,我们通过充分利用CUDA的层次化并行机制及其库函数,设计了FFTH的高效率的CUDA算法.对于规模为3X2048。的双精度复数类型数据,我们设计的CUDA程序与CPU串行程序相比可以达到12倍加速比,如果不计内存和显存之间的数据传输,则加速比可达40倍;其计算效率与CUFFT所提供的二维方形区域FFT程序的效率基本一致.在此基础上,我们通过研究GPU上分布式并行数据的转置与排序算法,优化设计了FFTH的CUDA-MPI算法.在3×8192^2的数据规模、10节点X6GPU的计算环境下,我们的CUDA-MPI程序与CPU串行程序相比达到了55倍的加速;其效率比MPI并行版FFTW以及基于CUFFT本地计算和FFTW并行转置的方形区域并行FFT的效率都要高出很多.FFTH的CUDA-MPI算法研究和测试为大规模CPU+GPU异构计算机系统的可扩展新型算法的探索提供了参考.
陈家杰
李会元
张先轶
一种采用带有局部信息的压缩稀疏行的稀疏矩阵存储方法及基于该方法的SpMV实现方法
本发明公开一种稀疏矩阵的存储方法CSRL及SpMV实现方法,按行扫描稀疏矩阵A,用数组val顺序存储每个非零元值信息;定义列下标连续的若干个非零元为一个连续非零元段,用数组jas记录每个连续非零元段的第一个元素的列下标,...
刘芳芳
张云泉
张先轶
王茜
文献传递
基于x86架构的稠密矩阵乘法汇编代码自动生成方法
本发明公开了一种基于x86架构的稠密矩阵乘法汇编代码自动生成方法,属于计算机系统应用技术领域。本方法为:1)将稠密矩阵乘法中的源矩阵A、B分别划分为多个子块矩阵;其中,矩阵A划分的子块矩阵A<Sub>Mc*Kc</Sub...
王茜
张先轶
张云泉
文献传递
P-QuantWiz:一种基于质谱的并行非标记定量软件
本文设计并实现了基于质谱的非标记定量软件QuantWiz,通过改变肽段定量的顺序,提高了定量软件的时间局部性和质谱数据缓存的命中次数。分析了QuantWiz的多种数据并行策略,设计并实现了按保留时间划分的并行定量软件P-...
胡泽林
张云泉
王靖
张先轶
关键词:
色谱峰
文献传递
P-QuantWiz:一种基于质谱的并行非标记定量软件
被引量:1
2009年
本文设计并实现了基于质谱的非标记定量软件QuantWiz,通过改变肽段定量的顺序,提高了定量软件的时间局部性和质谱数据缓存的命中次数。分析了QuantWiz的多种数据并行策略,设计并实现了按保留时间划分的并行定量软件P-QuantWiz。通过实验验证P-QuantWiz具有良好的并行效率,当进程数为32时,并行效率为63%。
胡泽林
张云泉
王靖
张先轶
关键词:
质谱
色谱峰
并行化
OpenBLAS:龙芯3A CPU的高性能BLAS库
BLAS是科学计算中最基础的数学库之一,各CPU厂商都推出了针对各自CPU的优化的BLAS库。龙芯CPU是中科院计算所自主研制的通用CPU,目前已推出了龙芯3号系列。本文介绍了我们发起的基于GotoBLAS 2-1.13...
张先轶
王茜
张云泉
关键词:
数学库
通用CPU
JULIA语言与并行计算
张常有
张先轶
基于x86架构的稠密矩阵乘法汇编代码自动生成方法
本发明公开了一种基于x86架构的稠密矩阵乘法汇编代码自动生成方法,属于计算机系统应用技术领域。本方法为:1)将稠密矩阵乘法中的源矩阵A、B分别划分为多个子块矩阵;其中,矩阵A划分的子块矩阵A<Sub>Mc*Kc</Sub...
王茜
张先轶
张云泉
文献传递
全选
清除
导出
共2页
<
1
2
>
聚类工具
0
执行
隐藏
清空
用户登录
用户反馈
标题:
*标题长度不超过50
邮箱:
*
反馈意见:
反馈意见字数长度不超过255
验证码:
看不清楚?点击换一张