登录注册
针对具有高浮点运算能力的流处理器设备GPU 对神经网络的适用性问题,提出卷积神经网络的并行化识别算法,采用计算统一 设备架构(CUDA)技术,并定义其上的并行化数据结构,描述计算任务到CUDA 的映射机制。实验结果证明,在GTX200 硬件架构的GPU 上实现的并行识别算法的平均浮点运算能力峰值较CPU 上串行算法提高了近60 倍,更适用于神经网络的相关应用。
下载次数 1次 资源类型 学术论文 上传时间 2018-04-12
惠美丽
kuaidajian.com
< 1/1 >
已有2人来访过
留言
现在还没有留言