2024年11月30日
星期六
|
欢迎来到维普•公共文化服务平台
登录
|
进入后台
[
APP下载]
[
APP下载]
扫一扫,既下载
全民阅读
职业技能
专家智库
参考咨询
您的位置:
专家智库
>
>
赵玉文
作品数:
20
被引量:6
H指数:2
供职机构:
中国科学院软件研究所
更多>>
发文基金:
国家自然科学基金
北京市自然科学基金
中国科学院战略性先导科技专项
更多>>
相关领域:
自动化与计算机技术
理学
更多>>
合作作者
刘芳芳
中国科学院软件研究所
杨超
中国科学院软件研究所
蒋丽娟
中国科学院软件研究所
解庆春
中国科学院软件研究所
孙乔
中国科学院软件研究所
作品列表
供职机构
相关作者
所获基金
研究领域
题名
作者
机构
关键词
文摘
任意字段
作者
题名
机构
关键词
文摘
任意字段
在结果中检索
文献类型
15篇
专利
5篇
期刊文章
领域
10篇
自动化与计算...
1篇
理学
主题
10篇
大整数
7篇
大整数乘法
5篇
FFT
5篇
并行化
4篇
调度
4篇
调度策略
4篇
动态调度
4篇
动态调度策略
4篇
数据相关
4篇
数据相关性
3篇
多核
3篇
多核并行
3篇
处理器
3篇
COMB
3篇
OPENMP
2篇
代码
2篇
代码设计
2篇
代数
2篇
递归
2篇
多线程
机构
20篇
中国科学院软...
3篇
北京大学
3篇
中国科学院大...
作者
20篇
赵玉文
19篇
刘芳芳
15篇
杨超
10篇
蒋丽娟
6篇
解庆春
5篇
孙乔
3篇
马文静
2篇
张鹏
2篇
李会元
2篇
杜胜
2篇
钟伟
2篇
申超
2篇
许永超
2篇
刘昊
1篇
孙家昶
1篇
蔡颖
传媒
3篇
软件学报
1篇
计算机系统应...
1篇
数值计算与计...
年份
3篇
2023
1篇
2021
2篇
2020
2篇
2019
2篇
2018
4篇
2017
3篇
2016
3篇
2015
共
20
条 记 录,以下是 1-10
全选
清除
导出
排序方式:
相关度排序
被引量排序
时效排序
基于浮点数压缩技术的大规模FFT实现方法及装置
本公开涉及一种基于浮点数压缩技术的大规模FFT实现方法及装置,所述方法包括:对第i个维度的FFT计算结果进行共享指数浮点数压缩,并将压缩结果打包成第i个维度的压缩数据之后,拷贝至所述主机端;获取所述第i个维度的压缩数据后...
赵玉文
刘芳芳
马文静
李会元
彭远驰
基于浮点数压缩技术的大规模FFT实现方法及装置
本公开涉及一种基于浮点数压缩技术的大规模FFT实现方法及装置,所述方法包括:对第i个维度的FFT计算结果进行共享指数浮点数压缩,并将压缩结果打包成第i个维度的压缩数据之后,拷贝至所述主机端;获取所述第i个维度的压缩数据后...
赵玉文
刘芳芳
马文静
李会元
彭远驰
一种大整数乘法Karatsuba算法的并行实现方法
本发明公开了一种大整数乘法Karatsuba算法的并行实现方法,基于64位无符号长整型整数操作,通过巧妙的公式转换技巧,指针运算以及存储方式,以解决部分积存储与计算的相关性问题,通过OpenMP多线程编程,采用secti...
蒋丽娟
杜胜
杨超
许永超
刘芳芳
钟伟
赵玉文
申超
文献传递
一种大整数乘法Comba算法基于OpenMP的并行实现方法
本发明公开了一种大整数乘法Comba算法基于OpenMP的并行实现方法,基于64位无符号长整型整数操作,通过添加三个临时数组存储加乘操作计算得到的中间结果,从而解决加乘运算与进位运算的数据相关性,将加乘操作与进位操作分开...
蒋丽娟
杨超
刘芳芳
赵玉文
解庆春
一种基于申威平台的基础线性代数库BLAS三级函数GEMM的高性能实现方法
本发明提出了一种基于申威平台的基础线性代数库BLAS三级函数GEMM的高性能实现方法,针对国产申威SW1600平台,采用“interface接口?driver驱动?kernel汇编核心代码”的三层代码设计框架,使用乘加指...
刘昊
杨超
刘芳芳
赵玉文
张鹏
孙乔
大整数乘法Sch?nhage-Strassen算法的多核并行化研究
被引量:2
2018年
基于数论转换的Sch?nhage-Strassen算法(简称SSA)是目前实际应用中使用较多、速度较快的大整数乘法算法之一.首先对SSA算法原理进行了详细分析,然后从细粒度的角度对SSA算法在多核平台进行比较细致的并行优化.基于大整数运算开源库GMP实现了SSA算法并行化方案,并在Intel X86平台进行了验证和测试.经测试,8线程时的最大加速比可达到6.59,平均加速比6.41.在浪潮TS850服务器对并行方案的扩展性进行测试,实验结果表明:SSA算法并行方案具有良好的扩展性,最大加速比可达21.42.
赵玉文
刘芳芳
蒋丽娟
杨超
关键词:
大整数乘法
傅里叶变换
FFT
多核并行
国产申威26010众核处理器上多维FFT的高性能实现方法
本发明提出一种国产申威26010众核处理器上多维FFT的高性能实现方法,基于国产处理器申威26010平台,将两层分解的一维FFT的求解算法,有效应用于多维FFT计算,并设计带输入输出跨度的FFT、多行一维FFT和多列一维...
杨超
赵玉文
张佳佳
刘芳芳
孙乔
文献传递
基于FFT的大整数乘法SSA算法多核并行化实现方法
一种基于FFT的大整数乘法SSA算法多核并行化实现方法,其是从细粒度的角度对大整数乘法SSA算法进行多核并行优化,其核心是对利用SSA算法求取负循环卷积的四个核心计算过程分别进行并行设计,即分别对分解、FFT正变换、点乘...
赵玉文
刘芳芳
杨超
解庆春
蒋丽娟
一种基于GMP的大整数加法和减法多核并行化实现方法
本发明涉及一种基于GMP的大整数加法和减法多核并行化实现方法,首先借助于临时数组来解决加法或减法操作产生的进位或借位带来的数据相关性问题,然后采用将迭代循环for中的运算进行任务划分,基于OpenMP多线程编程实现,使用...
赵玉文
刘芳芳
解庆春
杨超
蒋丽娟
一种大整数乘法Karatsuba算法的并行实现方法
本发明公开了一种大整数乘法Karatsuba算法的并行实现方法,基于64位无符号长整型整数操作,通过巧妙的公式转换技巧,指针运算以及存储方式,以解决部分积存储与计算的相关性问题,通过OpenMP多线程编程,采用secti...
蒋丽娟
杜胜
杨超
许永超
刘芳芳
钟伟
赵玉文
申超
文献传递
全选
清除
导出
共2页
<
1
2
>
聚类工具
0
执行
隐藏
清空
用户登录
用户反馈
标题:
*标题长度不超过50
邮箱:
*
反馈意见:
反馈意见字数长度不超过255
验证码:
看不清楚?点击换一张