王裕民
- 作品数:1 被引量:5H指数:1
- 供职机构:中国科学技术大学计算机科学与技术学院更多>>
- 相关领域:自动化与计算机技术更多>>
- 多GPU环境下的卷积神经网络并行算法被引量:5
- 2017年
- 随着深度学习的不断发展,卷积神经网络凭借其优异的识别性能,在图像识别、语音识别等领域受到了越来越多的关注.卷积神经网络的研究需要进行充分的实验,然而其训练过程通常需要大量时间.使用高性能GPU可以加速卷积神经网络的训练过程,但是由于GPU的特殊结构,进行多GPU的扩展时难以取得令人满意的加速比.提出一种在多GPU下的数据并行算法,与传统的客户机/服务器结构不同,该算法以环形结构组织GPU,更有利于多GPU扩展,系统不会受限于服务器节点的性能.此外还通过并行化单个GPU的计算与传输任务,提高GPU的使用效率.实验结果表明,使用4个GPU时,该算法分别在mnist和cifar10数据集上取得了3.77和3.79倍的加速比,并且对网络的识别性能无显著影响.
- 王裕民顾乃杰张孝慈
- 关键词:卷积神经网络GPU