您的位置: 专家智库 > >

国家高技术研究发展计划(2008AA01Z110)

作品数:15 被引量:37H指数:4
相关作者:彭林杨灿群谢伦国张小强吴强更多>>
相关机构:国防科学技术大学更多>>
发文基金:国家高技术研究发展计划国家自然科学基金国家科技重大专项更多>>
相关领域:自动化与计算机技术交通运输工程机械工程更多>>

文献类型

  • 15篇期刊文章
  • 1篇会议论文

领域

  • 16篇自动化与计算...
  • 1篇机械工程
  • 1篇交通运输工程

主题

  • 7篇处理器
  • 5篇多核
  • 5篇多核处理
  • 4篇多核处理器
  • 4篇事务存储
  • 3篇编程
  • 3篇GPU
  • 2篇多线程
  • 2篇线程
  • 2篇STM
  • 2篇CELL处理...
  • 2篇并发
  • 2篇OPENMP
  • 1篇迭代
  • 1篇迭代法
  • 1篇迭代算法
  • 1篇动力学
  • 1篇动力学模拟
  • 1篇动态电压调节
  • 1篇性能分析

机构

  • 16篇国防科学技术...
  • 1篇湖南第一师范...

作者

  • 6篇彭林
  • 6篇杨灿群
  • 5篇张小强
  • 5篇谢伦国
  • 3篇黄春
  • 3篇陈娟
  • 3篇吴强
  • 2篇杜云飞
  • 2篇贾建斌
  • 2篇王锋
  • 2篇葛振
  • 1篇徐炜遐
  • 1篇刘来国
  • 1篇杨学军
  • 1篇易会战
  • 1篇彭元喜
  • 1篇李春江
  • 1篇赵克佳
  • 1篇唐玉华
  • 1篇翁捷

传媒

  • 8篇计算机工程与...
  • 3篇计算机科学
  • 2篇计算机研究与...
  • 1篇计算机学报
  • 1篇计算机工程

年份

  • 3篇2011
  • 4篇2010
  • 8篇2009
  • 1篇2008
15 条 记 录,以下是 1-10
排序方式:
基于OpenMP/Fortran的源到源转换事务存储编程环境
2011年
首次在Fortran语言中引入事务存储,对OpenMP Fortran API进行了扩展,以源到源转换的方式实现了FortranTM编译器原型。针对软件事务存储实现的特点,扩展了EXCLUDED和SCHEDULE指导命令子句,以便为程序员提供性能调整优化API。测试结果表明FortranTM API编程便利,具有良好的性能。
黄春贾建斌彭林
关键词:事务存储
面向STM的松弛存储一致性算法
2010年
软件事务性内存(STM)提供同步手段,让多线程程序高效并发执行。如果两个事务访问了同一个共享数据且至少一个事务进行了修改操作,则称发生了冲突。检测冲突后,一般选择一个事务终止。当前的STM实现都基于严格的线性一致性(Linearizability)语义模型,实现简单。但是,基于该语义会导致很多本来可以完成提交的事务失败,降低了系统效率。把因果一致性模型应用于STM,可以在保证程序准确性条件下取得较好的实际性能。实验数据表明,该算法简单高效,明显减少了冲突数目。
张小强彭林黄春谢伦国
关键词:并发多线程
事务存储系统被引量:11
2009年
多核处理器性能的发挥依靠程序的并行,共享存储并行编程模型为大多数多核处理器所采用,而有效同步多个线程对共享变量的访问是其关键、也是难题.借鉴数据库中事务的思想,人们提出事务存储(transactional memory),旨在提供一种编程简单,对程序正确性推理容易的同步手段.简介了事务存储的起源,诠释了事务存储系统的概念.论述了事务存储的编程接口和执行模型.讨论了事务存储系统所涉及的主要内容,对各种方法和策略进行了比较.对事务存储中有待解决的问题进行了探讨.最后介绍了几个开源的事务存储研究平台.
彭林谢伦国张小强
关键词:事务存储多核处理器共享存储并行编程
线性系统求解中迭代算法的GPU加速方法被引量:4
2009年
在求解线性系统时,迭代法是一种基本的方法,特别是在系数矩阵为大规模稀疏矩阵的情况下,高效地使用迭代法求解变得十分重要。本文通过分析迭代法的一般特点,提出了使用具有强大计算能力和存储带宽的GPU加速迭代法的一般方法。利用这些方法,在两种主流GPU平台上实现了一个经典的迭代法PQMRCGSTAB,并且针对不同的GPU平台特点提出了具体的优化方法。与AMD Opteron 2.4GHz 4核处理器相比,双精度版本的PQMRCGSTAB算法经NVIDIA Tesla S1070加速后性能提高31倍,经AMD Radeon HD 4870 X2加速后性能提高9倍。
葛振杨灿群吴强陈娟
关键词:GPU迭代法
基于OpenCL的MD5破解算法被引量:5
2011年
在基于GPU的异构平台上,采用开放计算语言(OpenCL)实现破解算法,利用分轮生成攻击密码、图形渲染管线加速存取以及多密码并行等方法对算法进行优化,在Intel四核CPU Q8230(2.3 GHz)和一片NVIDIA GT200组成的平台上进行实验。实验结果表明,在相同CPU平台上该算法能够获得高于破解软件John the ripper 17倍的破解速度。
翁捷吴强杨灿群
关键词:图形处理器
采用向量时钟的软件事务存储算法
2010年
在多核处理器上,事务存储是一种有望取代锁的同步手段。软件事务存储不需要增加额外硬件支持,就可以充分利用当前商业多核处理器的多线程能力。提出一种软件事务存储实现算法VectorSTM,该算法不需要使用原子操作。VectorSTM采用分布的向量时钟来跟踪各线程事务执行情况,能够提供更高的并发度。对事务存储基准程序STAMP的测试表明,VectorSTM在性能或者语义上比软件事务存储算法TL2和RingSTM有优势。
彭林谢伦国张小强
关键词:多核处理器
一种实用的自动代码划分算法
2010年
在编译器中进行自动代码划分然后采用代码重叠技术,是内存容量较小的处理器发挥性能的关键技术之一。随着异构多核处理器的出现,这类处理器通常作为协处理器。本文提出了一种实用的自动代码划分算法,并面向Cell处理器在GNU工具链中进行了实现。该算法首先根据调用频率发现调用热点,然后采用简化的聚类方法进行热点指导的分区聚集,最后进行容量指导的分区合并。实验结果表明,算法复杂度较低并能取得很好的效果。
杨灿群李春江王锋
关键词:CELL处理器
事务存储并行程序编程接口研究被引量:1
2010年
事务存储并行程序编程接口按照实现方式和实现层次的不同,分为三种形式:库函数接口、语言扩展和编译器指导命令。本文以RSTM、英特尔C/C++软件事务存储编译器原型和OpenTM为例,讨论了三种事务存储编程接口的特点,对OpenTM编程接口进行了扩展和完善,并对未来编程接口的发展进行了展望。
贾建斌黄春赵克佳
关键词:事务存储
事务存储中的一种自适应冲突检测算法被引量:2
2009年
事务存储被认为是极具前景的多核处理器并行编程的手段,但存在开销过大的问题。采用Bloom Filter对事务间访问共享变量进行冲突检测,能够有效地降低开销,但其存在误判会导致不必要的事务作废,因此要尽可能减少。简要介绍了Bloom Filter和事务存储,提出了一种事务存储的自适应冲突检测算法ACDA,根据事务读写集合大小自适应地调整Bloom Filter的位串大小,在较低开销的情况下,保持误判率不增加。分析了软件事务存储中实现ACDA的特点,初步实现ACDA,与主流软件事务存储实现RSTM相比,在事务存储测试程序STAMP中,开销可接受的前提下,减少因误判而作废的事务最高达93%。给出了对ACDA哈希函数进一步优化的思路。
彭林谢伦国张小强
关键词:多核处理器BLOOMFILTER事务存储
容错并行算法的性能分析被引量:2
2009年
容错并行算法是一种应用级容错方法,它通过并行复算的方法实现快速的故障恢复。容错并行算法是在并行算法设计的基础上增加了容错设计部分,因此其性能评估必须考虑故障对程序性能的影响。研究了评估故障情况下容错并行算法性能的各种度量,建立了性能模型预测容错并行算法的期望执行时间,以此为基础评估了程序段的运行时间、数据保存开销、故障率以及并行复算加速比等系统参数对容错并行算法性能的影响。
杜云飞唐玉华杨学军
关键词:容错并行算法加速比
共2页<12>
聚类工具0