您的位置: 专家智库 > >

刘刚

作品数:10 被引量:44H指数:4
供职机构:深圳大学计算机与软件学院更多>>
发文基金:国家自然科学基金广东省自然科学基金国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术电子电信文化科学更多>>

文献类型

  • 9篇中文期刊文章

领域

  • 9篇自动化与计算...
  • 2篇电子电信

主题

  • 5篇网络
  • 5篇感器
  • 5篇传感
  • 5篇传感器
  • 5篇传感器网
  • 5篇传感器网络
  • 4篇无线传感
  • 4篇无线传感器
  • 4篇无线传感器网
  • 4篇无线传感器网...
  • 3篇龙芯
  • 2篇中继
  • 2篇数据预取
  • 2篇矩阵
  • 2篇矩阵乘
  • 2篇矩阵乘法
  • 2篇计算机
  • 2篇乘法
  • 2篇传感器节点
  • 1篇电池

机构

  • 9篇深圳大学
  • 2篇中国科学院

作者

  • 9篇刘刚
  • 7篇毛睿
  • 6篇陆克中
  • 3篇罗秋明
  • 3篇陈国良
  • 3篇冯禹洪
  • 3篇明仲
  • 2篇张滇
  • 2篇陶耀东
  • 2篇张恒
  • 1篇江钊
  • 1篇蔡晔
  • 1篇李昀
  • 1篇董文涛

传媒

  • 3篇小型微型计算...
  • 3篇深圳大学学报...
  • 1篇计算机研究与...
  • 1篇电子学报
  • 1篇中国科学:信...

年份

  • 3篇2014
  • 1篇2013
  • 3篇2012
  • 1篇2011
  • 1篇2010
10 条 记 录,以下是 1-9
排序方式:
基于龙芯3B处理器的Linpack优化实现被引量:3
2014年
HPL是高性能计算广泛采用的Linpack测试软件包.针对龙芯3B处理器体系结构的特点,为Linpack中的核心部分——矩阵乘法设计矩阵分块策略,利用龙芯3B的cache锁机制将频繁调用的数据分块锁在cache中,从而显著降低cache缺失率.同时为龙芯3B处理器中的访存加速部件设计了高效的预取算法,以实现计算时间掩盖访存时间.另外,分别对Linpack所调用的dtrsm和行交换等热点函数进行优化,并通过参数训练来优化Linpack参数.实验结果表明,在龙芯3B处理器上,单节点4核以及双节点8核的Linpack实测性能均达到理论峰值的60%左右,优化后的Linpack性能较优化前提升了10倍左右.
刘刚张恒张滇毛睿
关键词:计算机系统结构矩阵乘法数据预取
面向龙芯3B1500体系结构的DGEMM函数优化被引量:3
2014年
双精度普通矩阵乘法DGEMM函数是高性能计算基础软件BLAS库中最重要的第三级函数.本文针对龙芯3B1500处理器体系结构的特点,利用保留的物理内存与大页技术减少内存页的换进换出以及TLB缺失,通过龙芯128位向量访存指令和向量乘加指令实现矩阵乘法的向量化运算,同时针对矩阵乘法中各矩阵的访存特点设计合理分块策略,并运用3B1500的cache锁机制将重复利用率高的分块锁在cache中以减少cache缺失,最后针对矩阵A和B的预取时间大于计算时间这一问题,设计了一种新的矩阵预取算法.该预取算法通过增大核心计算的计算量,将矩阵A和B的预取时间全部掩藏在计算中,并且通过ld指令与$0寄存器的配合使用来实现对C矩阵的预取.优化后的DGEMM函数无论在单线程和多线程时的性能都达到了理论峰值的80%以上.
刘刚张恒张恒毛睿
关键词:BLAS矩阵乘法数据预取
无线传感器网络中继节点的最小功耗布置算法被引量:6
2011年
在无线传感器网络中,如何布置给定数量的中继节点以最小化传输数据的整体功耗是个值得关注的问题.对中继节点的最小功耗布置问题进行了形式化描述,提出一种时间复杂度为O(n2)的近似算法,其中n为传感器节点数目.该算法先构造一棵中继节点数目不受限制时的最优生成树,然后每次从生成树中删除一个使得整体功耗增加最少的中继节点,直至生成树中的中继节点数目满足要求.实验结果表明该算法的执行时间较短,在传输数据的整体功耗方面要优于现有算法.
陆克中刘刚陶耀东明仲
关键词:无线传感器网络中继节点生成树
有向传感器网络覆盖增强问题的贪婪迭代算法被引量:11
2012年
在有向传感器网络中,可以通过调整节点的感知方向来增强目标区域的覆盖率.提出了有向传感器网络覆盖增强问题的一种贪婪迭代算法,在每次迭代中,调整那些使得覆盖率增加最大的节点的感知方向,重复此迭代过程直至通过调整任一节点的感知方向已不能再增加覆盖率.此外,还提出了一种通过计算几何求解该算法中区域计算问题的方法,以提高计算精度和减少计算时间.大量的仿真实验结果表明,该算法的执行时间较短,收敛速度较快,能够获得比现有算法更高的目标区域覆盖率.
陆克中冯禹洪毛睿罗秋明刘刚
关键词:无线传感器网络贪婪算法迭代算法
无线传感器网络最小中继节点布置问题的近似算法被引量:3
2010年
为了消除传感器节点路由负载的不平衡,可在无线传感器网络中布置少量功能较强的中继节点作为路由节点,最小化中继节点数是其主要优化目标.文中证明了有界平面区域上的中继节点布置问题是P问题,但一般情况下的计算复杂度相当巨大.从中继节点布置问题的几何覆盖特征出发,提出了一种O(n^2 log n)时间的贪心近似算法,其中n为传感器节点数目.在该算法迭代过程的每一阶段,先从未被覆盖的传感器节点中选出一个关键节点,为了阻止孤立节点的产生,再按照"优先覆盖与关键节点距离较近的传感器节点"的原则来确定中继节点的位置.实验结果表明该算法可在很短的时间内生成一个接近最优的可行中继节点布置,且在中继节点布置的尺寸以及执行时间方面都要优于现有算法.
陆克中陈国良冯禹洪冯禹洪毛睿
关键词:无线传感器网络贪心算法
大规模分布式系统的节点扰动及周期性分析被引量:1
2012年
在大规模分布式系统中,节点加入与退出所产生的扰动行为对系统性能有直接影响.当前关于节点扰动的行为模型主要描述节点达到和持续时长的统计特性,同时也对节点进行分类并赋予不同的统计值.从全球规模的视角上考察其扰动行为,需要在更高层面上加以描述.以各时区为单位划分其统计特性将合理解释网络规模呈周期性变化的现象,并可以隐含推测各时段网络的构成成份,进而可以用于优化覆盖网的维护或者备份数据的冗余管理等目的.时区扰动模型的基础在于全球节点的地理位置分布和各时区内用户相对统一的行为模式.在单个时区内用户可以进一步细分为不同类型,各个类型的用户群则可以用传统的到达间隔和会话持续时间来描述.根据此模型所产生出的扰动事件序列对系统节点扰动行为的模拟更加精确,解决了描述节点总数量变化的时间和快慢问题,同时也解决了这些数量变化是由哪些节点引起的问题.由于节点的变化更加精确并具有规律性,因此在对数据存储等应用上可以作为优化的依据之一.
罗秋明李昀陶耀东董文涛刘刚
关键词:分布式系统
基于蜂窝结构的传感器网络覆盖问题求解算法被引量:5
2012年
在无线传感器网络中,求解能够完全覆盖目标区域的最小覆盖集是个NP难问题.在传感器节点数目较多时,目前只能通过近似算法求解.蜂窝结构是覆盖二维平面的最佳拓扑结构,但不能直接用于求解无线传感器网络的覆盖问题.提出了一种基于蜂窝结构的覆盖问题求解算法,在该算法迭代求解过程的每一阶段,选出一个节点加入到初始为空的节点集合中,并使得该节点集合的拓扑结构接近于蜂窝结构,直至该节点集合成为覆盖集.该算法在最坏情况下的时间复杂度为O(n3),这里n为传感器节点总数.实验结果表明该算法可在很短的时间内执行完,在所得覆盖集的大小方面要优于现有的覆盖问题求解算法.
陆克中江钊毛睿刘刚明仲
关键词:无线传感器网络网络生存时间NP难问题蜂窝结构
基于传感器节点的无线接收信号强度研究(英文)被引量:4
2014年
在真实室内环境中,用MICA2节点设计分析影响无线接收信号强度(radio signal strength,RSS)的实验,发现其影响因素不仅包括发送接收方(transmitter-receiver,T-R)之间的距离,且MICA2节点的工作频率和供电电池电压、发送接收方节点差异、天线角度和高度,以及环境中的时空因素和动态环境等都会影响无线接收信号强度.经分别测试这些因素,建议传统无线信号传播模型和信号校准算法应综合考虑各项影响因素.
张滇明仲刘刚陆克中毛睿冯禹洪陈国良
关键词:传感器网络电池电压动态环境
KD-90普及型个人高性能计算机系统设计与性能优化被引量:8
2013年
报道中国首台采用自主设计研制的龙芯3B 8核处理器的万亿次高性能计算机系统KD-90.该系统具有高计算密度、低功耗、低成本、低占地的特点,其应用SMP→CC-NUMA→Cluster 3级并行体系结构,采用通用协议与专用协议结合的互连网络硬件设计,实现了CC-NUMA机群架构关键技术的突破;应用矢量部件加速技术实现了一种通用处理器与向量协处理器相结合的编程模型.结合体系结构特点和操作系统内核对系统性能优化并进行了性能测试和分析.
蔡晔刘刚毛睿罗秋明陈国良
关键词:计算机工程龙芯
共1页<1>
聚类工具0