您的位置: 专家智库 > >

周伟

作品数:9 被引量:14H指数:2
供职机构:中国科学技术大学信息科学技术学院自动化系更多>>
发文基金:国家自然科学基金国家科技重大专项国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 9篇中文期刊文章

领域

  • 9篇自动化与计算...

主题

  • 3篇雷达
  • 2篇聚类
  • 2篇聚类算法
  • 2篇快速聚类
  • 2篇雷达回波
  • 2篇回波
  • 2篇GPU
  • 2篇处理器
  • 1篇动态链接
  • 1篇动态链接库
  • 1篇信道
  • 1篇性能计数器
  • 1篇虚拟仪器
  • 1篇虚拟仪器设计
  • 1篇移植性
  • 1篇仪器设计
  • 1篇拥塞
  • 1篇拥塞控制
  • 1篇拥塞控制策略
  • 1篇上下文

机构

  • 8篇中国科学技术...
  • 4篇中国人民解放...
  • 2篇中国科学院

作者

  • 9篇周伟
  • 4篇安虹
  • 2篇吴石磊
  • 2篇刘谷
  • 2篇李小强
  • 1篇陈萍
  • 1篇王晓蒲
  • 1篇戴宗友
  • 1篇霍剑青
  • 1篇汤旭龙
  • 1篇袁广林
  • 1篇季海波
  • 1篇洪佩琳
  • 1篇牛文波
  • 1篇魏学超
  • 1篇谭小彬
  • 1篇薛开平
  • 1篇许牧
  • 1篇刘玉
  • 1篇汪群山

传媒

  • 3篇计算机科学
  • 2篇计算机工程
  • 1篇微电子学与计...
  • 1篇小型微型计算...
  • 1篇计算机仿真
  • 1篇中国科学院研...

年份

  • 2篇2015
  • 1篇2013
  • 3篇2012
  • 1篇2011
  • 1篇2010
  • 1篇2006
9 条 记 录,以下是 1-9
排序方式:
组网雷达估测降水系统并行化方案的设计与实现被引量:5
2012年
国家气象局天气组网雷达定量估测降水系统不仅拥有较大的计算量,而且具有较大的数据吞吐量,同时对实时性要求较高。如果缩短其执行时间,无疑将会带来巨大的收益。鉴于这些特点,使用VTune Amplifer XE对串行程序进行了热点分析和并行性分析,得出程序中有较多线程级并行性,从而制定了相应的并行化方案;然后使用Win32多线程和OpenMP两种技术对该程序在Intel四核处理器平台上进行了并行化。程序主要由单站处理和组网处理两部分组成。由于计算资源的限制,并行后的单站处理程序只有大约10%的性能提升,而组网处理程序则可以达到近似线性的性能提升。通过调整计算负载,并行化版本的加速比可以达到5.5。最后,可以得出该并行化方法适用于计算密集且数据吞吐量较大的一类应用。
吴石磊安虹李小强周伟刘谷魏学超
关键词:并行性分析OPENMP
一种输入感知的雷达回波快速聚类实现
2012年
聚类算法作为数据挖掘中的经典算法,在雷达回波的数据分析中经常被采用。然而对于规模和维度都较大的输入数据集,算法十分耗时。很多研究虽然对聚类算法进行了GPU平台的并行和优化的工作,但都忽略了输入数据集对优化的影响。因此,提出了在GPU/CUDA平台上的一种新颖的雷达快速聚类实现。该实现通过运行时的方式对输入的回波数据进行观察,以获取数据的分布信息,用以指导聚类计算在GPU上执行时的线程块调度。而该运行时模块本身的开销非常小。实验表明,引入这种输入感知的运行时调度支持后,大大削减了GPU的计算负载,获得了相对于一般策略的CUDA实现的20%~40%的性能提升,加强了算法的实时性能。
周伟安虹刘谷李小强吴石磊
关键词:聚类算法图形处理器统一计算设备架构
一种类数据流驱动的可重构众核流处理器设计被引量:1
2013年
传统的片上多核结构存在着计算资源粒度固定的缺点,无法满足应用在不同阶段对计算资源的差异化需求.针对上述问题,本文设计了运行时逻辑核可调整的可重构众核流处理器及流程序映射方案,以期满足应用各个阶段对计算资源的需求,且不造成资源浪费.通过在时钟精确软件模拟器上评估不同类型应用的性能表现,分析了处理器主要设计参数对性能的影响.实验结果表明,与具有同样计算资源的固定粒度流处理器相比,本文设计的可重构众核流处理器能够获得10%-30%的性能提升.
许牧安虹汤旭龙周伟
关键词:可重构流编程模型
CPU-GPU协同计算的并行奇异值分解方法被引量:2
2015年
在目标跟踪应用中,常常采用奇异值分解(SVD)作为基本工具进行动态建库。然而当每秒处理的数据量较大、计算精度要求较高时,SVD的计算耗时往往无法满足应用的实时性能要求。针对这一问题,提出了CPU-GPU协同计算的并行奇异值分解方法。该方法利用GPU与CPU间的异步执行,对奇异值分解过程进行划分从而构造软件流水线,大大挖掘软硬件的并行性。实验表明,该方法比一般的基于GPU的Jacobi方法有约23%的性能提升。相对于CPU上的Intel MKL的奇异值分解函数获得了6.8x的加速比,满足了应用中的实时性能要求。
周伟戴宗友袁广林陈萍
关键词:GPUJACOBI方法奇异值分解
机器类型通信中随机接入信道的拥塞控制策略被引量:2
2015年
在基于3GPP长期演进技术的机器类型通信(MTC)应用背景下,针对无线接入网络中随机接入信道的拥塞问题,提出一种改进的拥塞控制策略,MTC器件利用基站广播信息自适应调整各自的接入时间,避免由于大量MTC器件同时发起随机接入而引起接入碰撞的问题,实现基站的负载均衡及信道资源的合理分配。基于最大熵原理证明各MTC器件接入时间的均匀分布是最优分布。仿真实验结果表明,与接入类别限制策略相比,该策略可缓解随机接入信道的拥塞状况,提高MTC器件的随机接入成功率,降低接入时延,从而提升网络整体性能及服务质量。
周伟谭小彬季海波
关键词:随机接入信道拥塞控制均匀分布网络服务质量最大熵原理
Perf在龙芯2F上的设计与实现被引量:1
2011年
在龙芯2F平台上设计并实现性能调优工具Perf。分析Perf的实现原理,针对龙芯修改Perf内核层中体系相关部分代码,设计硬件性能计数器的操作函数集和溢出中断处理函数。使用Perf分析矩阵相乘测试用例,结果表明Perf得到的采样结果接近理论值,与Oprofile相比,采样数据更精确。
徐恒阳安虹刘玉周伟
关键词:性能计数器前端
基于XML和DLL的虚拟仪器设计被引量:2
2006年
该文提出了基于扩展性标识语言(XML)和动态链接库(DLL)技术的虚拟仪器的设计方法。该方法在MVC架构的虚拟仪器的基础上,将XML和DLL技术相结合应用到虚拟仪器的设计中,实现了虚拟仪器的自定义界面、功能扩充和仪器整合。用此方法设计的虚拟仪器具有可设计性、可扩展性、可移植性,安全性和易维护性大大提高,有效地改进和完善了虚拟仪器,并且在计算机仿真实验系统中得到了很好的应用,解决了计算机仿真实验系统设计中的难题。
周伟王晓蒲牛文波霍剑青
关键词:虚拟仪器动态链接库可移植性
基于GPU-CPU流水线的雷达回波快速聚类
2012年
提出了基于GPU-CPU流水线的雷达回波快速聚类方法.该方法利用GPU与CPU异步执行的特征,将聚类的各步骤组织成流水线,大大的挖掘了聚类全过程的的并行性.实验表明,引入这种GPU-CPU流水线机制后,该方法比一般策略的基于GPU的并行聚类算法性能有38%的提升,而相对于传统的CPU上的串行程序,获得了47x的加速比,满足了气象实时分析应用中的实时性要求.
周伟施宁王健汪群山
关键词:GPUCUDA聚类算法流水线
LTE网络中头标压缩的上下文转移机制被引量:1
2010年
提出了一种用于LTE网络中头标压缩功能的上下文转移方案,可以用来减小无线链路上的报文开销,降低切换时的信令时延,从而提高整个通信网络的效率.文中对头标压缩的上下文转移过程进行了详细描述,包括信令报文的处理、上下文转移参数的重建以及头标压缩状态的变迁.通过仿真分析,对方案的有效性进行了验证.该方案适用于语音通信为主的无线通信网络.
周伟洪佩琳薛开平
关键词:LTE网络上下文转移
共1页<1>
聚类工具0