您的位置: 专家智库 > >

郭利财

作品数:9 被引量:14H指数:2
供职机构:中国科学技术大学更多>>
发文基金:国家自然科学基金国家高技术研究发展计划国家科技重大专项更多>>
相关领域:自动化与计算机技术理学更多>>

文献类型

  • 4篇期刊文章
  • 4篇专利
  • 1篇学位论文

领域

  • 5篇自动化与计算...
  • 1篇理学

主题

  • 3篇数值模拟
  • 3篇龙芯
  • 3篇龙芯3A
  • 3篇多重网格
  • 3篇值模拟
  • 2篇树结构
  • 2篇数值模拟方法
  • 2篇线性方程组
  • 2篇向量
  • 2篇向量形式
  • 2篇精确解
  • 2篇汇编指令
  • 2篇方程组
  • 2篇并行计算
  • 2篇操作数
  • 1篇顶点
  • 1篇对齐
  • 1篇视频
  • 1篇视频分析
  • 1篇内容感知

机构

  • 9篇中国科学技术...
  • 2篇安徽省计算与...
  • 1篇安徽大学

作者

  • 9篇郭利财
  • 5篇顾乃杰
  • 4篇黄章进
  • 3篇任开新
  • 2篇彭飞
  • 2篇刘燕君
  • 2篇林传文
  • 1篇宁兰芳
  • 1篇梁娟娟

传媒

  • 2篇小型微型计算...
  • 1篇计算机应用与...
  • 1篇计算机系统应...

年份

  • 1篇2016
  • 1篇2014
  • 4篇2013
  • 1篇2012
  • 2篇2011
9 条 记 录,以下是 1-9
排序方式:
龙芯3A处理器上FFT的高效实现被引量:5
2012年
FFT(Fast Fourier transform,快速傅立叶变换)是工程应用中的一个基本算法,优化其性能对于推广龙芯系列处理器的应用具有重要意义.本文充分挖掘龙芯3A处理器的硬件特性,对运算量和调整位序的过程作了优化并使用128位访存来减少访存指令的比例,从而实现了高效的FFT算法.实验结果表明,在825M龙芯3A处理器上经过优化后的一维FFT的速度是FF-TW库的2.5倍左右,而二维FFT的速度则是FFTW的3倍左右.
郭利财刘燕君
关键词:龙芯3AFFT
一种用计算域分解的等几何分析并行化方法被引量:1
2013年
提出一种按照计算域分解的并行化方法来构建等几何分析的刚度矩阵和右侧向量.将计算域分解成为若干个不相交的子区域,然后为每个区域分配一个处理器,所有处理器并行进行子区域上面的计算,所有处理器完成子区域的计算以后,使用一个快速的归并算法完成线性系统的装配.实验表明,本文提出的方法在8核的机器上可以达到6.46的加速比,能够在4秒左右的时间计算680万个矩阵元素个数.使用Intel MKL稀疏求解器来求解线性系统,本文的等几何分析求解器能够在大约10秒的时间内求解52万的自由度,本文的方法比ISOGAT速度要快上万倍.
郭利财黄章进顾乃杰
关键词:并行计算
通过并行计算和多重网格提升等几何分析计算效率
等几何分析是一种新型的偏微分方程数值解法,广泛应用于工程领域。为了使等几何分析在众多工程领域中更加实用,需要研究如何提高等几何分析计算效率,实现高效的等几何分析求解器。本论文通过使用并行计算和多重网格方法来提升等几何分析...
郭利财
关键词:并行计算多重网格数值模拟
一种基于多重网格的快速等几何分析数值模拟方法
本发明基于多重网格的快速等几何分析数值模拟方法,特征是使用扩展的控制顶点将与当前几何表示对应的精确解变换到下一个几何表示的基函数展成的空间上,作为下一个几何表示对应的线性方程组的初始解,使用迭代算法在初始解的基础上进行迭...
顾乃杰郭利财任开新黄章进
文献传递
GPU上的矩阵乘法的设计与实现被引量:7
2011年
矩阵乘法是科学计算中最基本的操作,高效实现矩阵乘法可以加速许多应用。本文使用NVIDIA的CUDA在GPU上实现了一个高效的矩阵乘法。测试结果表明,在Geforce GTX 260上,本文提出的矩阵乘法的速度是理论峰值的97%,跟CUBLAS库中的矩阵乘法相当。
梁娟娟任开新郭利财刘燕君
关键词:矩阵乘法GPUCUDA
基于轴对齐变形的视频缩放技术的研究
2014年
多样化的显示设备对视频显示的适应性提出越来越高的要求。提出并实现一种基于轴对齐变形的内容感知视频缩放方法。首先根据梯度、人脸和运动的信息对视频进行分析,然后结合相邻帧信息建立二次规划系统进行变形求解。实验表明,求解方法简单有效,对有人脸或运动的视频进行缩放能够得到高质量的结果,能去除抖动现象。求解一帧可在毫秒级时间内完成,同时具有很好的鲁棒性。
宁兰芳黄章进郭利财
关键词:内容感知视频分析
一种基于龙芯3A向量访存的编译优化方法
本发明公开了一种基于龙芯3A向量访存的编译优化方法,特征是新增一条从向量树结构到中间表示的扩展路径,将向量形式的树结构转化为对应的中间表示;在扩展过程中,如果是正常模式,则沿着原有的路径进行扩展;如果是向量化的模式,则从...
顾乃杰彭飞林传文郭利财
一种基于龙芯3A向量访存的编译优化方法
本发明公开了一种基于龙芯3A向量访存的编译优化方法,特征是新增一条从向量树结构到中间表示的扩展路径,将向量形式的树结构转化为对应的中间表示;在扩展过程中,如果是正常模式,则沿着原有的路径进行扩展;如果是向量化的模式,则从...
顾乃杰彭飞林传文郭利财
文献传递
一种基于多重网格的快速等几何分析数值模拟方法
本发明基于多重网格的快速等几何分析数值模拟方法,特征是使用扩展的控制顶点将与当前几何表示对应的精确解变换到下一个几何表示的基函数展成的空间上,作为下一个几何表示对应的线性方程组的初始解,使用迭代算法在初始解的基础上进行迭...
顾乃杰郭利财任开新黄章进
文献传递
共1页<1>
聚类工具0