您的位置: 专家智库 > >

崔翔

作品数:8 被引量:12H指数:2
供职机构:河南大学计算机与信息工程学院更多>>
发文基金:国家自然科学基金国家高技术研究发展计划中国博士后科学基金更多>>
相关领域:自动化与计算机技术电子电信文化科学更多>>

文献类型

  • 7篇中文期刊文章

领域

  • 6篇自动化与计算...
  • 3篇电子电信

主题

  • 3篇矩阵
  • 3篇矩阵乘
  • 3篇矩阵乘法
  • 3篇傅里叶
  • 3篇傅里叶变换
  • 3篇乘法
  • 3篇程序设计
  • 2篇异构
  • 2篇异构集群
  • 2篇快速傅里叶变...
  • 2篇GPU
  • 1篇多QOS约束
  • 1篇多播
  • 1篇多播路由
  • 1篇多播路由协议
  • 1篇多播树
  • 1篇性能优化技术
  • 1篇优化技术
  • 1篇语言机制
  • 1篇设计方法

机构

  • 7篇河南大学
  • 3篇北京大学
  • 1篇中国人民解放...
  • 1篇河南财政金融...

作者

  • 7篇崔翔
  • 1篇邓未冰
  • 1篇赵伟
  • 1篇李晓雯

传媒

  • 2篇现代电子技术
  • 1篇计算机学报
  • 1篇计算机时代
  • 1篇软件学报
  • 1篇计算机科学
  • 1篇电子设计工程

年份

  • 1篇2020
  • 1篇2016
  • 1篇2015
  • 2篇2014
  • 1篇2013
  • 1篇2006
8 条 记 录,以下是 1-7
排序方式:
数组维度类型程序设计方法及高性能FFT实现被引量:1
2015年
异构集群多层次异构存储的特点,决定了在其上进行计算时,数据需要进行更多维度的划分.现有集群程序设计语言缺乏对多维数组传输和转置的统一表示机制.介绍多维数组维度转置的表示方法和课题组实现的Parray语言,可以对异构集群复杂数据维度变换的数据操作进行清晰表示.同时介绍基于数组维度类型程序设计方法和Parray语言实现的天河1A系统上的大规模3维FFT,该算法代码实现简洁,同时得到了良好的性能和可延展性.
崔翔李晓雯陈一峯
关键词:异构集群
多QoS约束的多播路由协议的改进
2006年
随着Internet、移动网络及高性能网络的不断发展,具有QoS约束的多播路由技术已成为网络及分布式系统领域的一个重要研究课题。文章研讨了具有多QoS约束的多播路由问题,其中主要包含延迟、延迟抖动、带宽、代价等QoS约束。针对现有多QoS约束的多播路由算法进行了改进,不仅有效减少了生成多QoS约束的多播树开销,而且能够很好地支持组成员的动态加入和离开,而不干扰现有的多播树。算法实例证明改进后的算法减少了报文转发的数量,从而降低了多播树生成时间。
赵伟崔翔邓未冰
关键词:服务质量多播路由多QOS约束QOS路由多播树
GPU矩阵乘法和FFT算法的性能优化被引量:5
2013年
当前GPU的体系结构为高性能计算提供了良好的可编程性。为了得到众核GPU高性能程序设计的一般方法,探索GPU程序性能优化技术,对在GPU上进行高性能程序设计的经验进行了总结。通过基准测试,得到GPU性能指标,对GPU程序设计进行指导。使用CUDA对单精度矩阵乘法和FFT进行性能优化,前一个算法是计算密集型任务,后一个算法是带宽密集型任务。在NVIDIA GeForce GTX280 GPU上,矩阵乘法算法达到393 Gflop/s的峰值速度,比CUBLAS 2.0数学库提高了5%;对于一些维度的FFT计算也取得了较好的性能。
李晓雯崔翔
关键词:矩阵乘法快速傅里叶变换性能优化技术
缓存结构GPU矩阵乘法算法的自动优化
2014年
讨论在Fermi结构GPU使用CUDA对GEMM(单精度和双精度)算法进行优化,以及Fermi体系结构的新特性(如缓存)对性能的影响。GPU缓存一方面可以提高处理器在运行时数据访问的局部性,另一方面使得代码性能对与性能相关算法参数的依赖变得不可预测。自动优化技术可以用来解决这一问题。自动优化的SGEMM和DGEMM代码在Tesla C2050 GPU上达到了563GFlops和253GFlops的性能。代码使用CUDA和C语言进行实现,未进行二进制代码级别的优化。
李晓雯崔翔殷瑞杰刘强
关键词:矩阵乘法
基于Parray数组类型的矩阵乘法实现被引量:1
2014年
介绍针对异构集群体系结构特点设计的编程接口Parray.Parray使用数组类型对数据的物理存储和逻辑结构进行分离.Parray使用统一的线程数组类型表示各种进程(线程)的创建以及它们之间的控制流转.通过矩阵乘法实例演示Parray程序设计的特点:该程序由一个单CPU线程程序演变为多CPU线程程序、再演变为GPU线程程序——程序的各次演变仅通过数组类型的变化和代码的细微修改即可完成.介绍使用Parray实现的高性能GPU矩阵乘法,在天河1A单节点上的测试性能和CUBLAS 4.0相当,同时该代码可以工作于不同物理存储方式的数组.
崔翔李晓雯陈一峯
关键词:GPU集群程序设计矩阵乘法编程接口
基于可信计算的多级安全策略研究被引量:4
2016年
针对现有安全策略模型BLP与BIBA结合应用存在可用性差的问题,通过引入可信度量机制提出了基于可信计算的多级安全策略TCBMLSP(Trust Computing Based Multilevel Security Policy),该策略能够保证主客体的行为可信,解决多级信息的安全流通,并通过可信计算的远程证明机制使得该策略能够应用于不同安全域之间的可信通信,较好的解决了可用性差的问题。
刘晓坦李晓雯崔翔
关键词:可信计算
基于新型语言机制的异构集群应用通信优化方法
2020年
与传统集群相比,异构集群具有较高的性价比。但相比迅速发展的硬件技术,当前软件技术仍然落后,不能适应不断更新的异构硬件和超大规模的并行计算环境。当前普遍采用的解决方案是直接使用针对不同硬件的并行编程工具,这一组合方案的缺点是编程层次低,开发、修改与调试困难。文中介绍了新型语言机制用于描述数据与线程的多维规则结构、排列方式以及通讯模式,提出了基于新型语言机制的不同类型异构系统之间的软件移植和优化方法。以直接法湍流模拟为例,实现了应用在不同异构系统上的通信优化和快速移植。
崔翔李晓雯陈一峯
关键词:异构集群程序设计快速傅里叶变换
共1页<1>
聚类工具0