基于CUDA的卷积神经网络算法实现-开题报告.docxVIP

下载本文档

114
0
约4.69千字
约 7页
2020-05-17 发布于湖南
举报
版权申诉

基于CUDA的卷积神经网络算法实现-开题报告.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

PAGE 2 - 本科生毕业设计（论文）开题报告题目：基于CUDA的卷积神经网络算法实现姓名：章飞学号： 201206060234 指导教师：齐勇班级：计本122 所在院系：电气与信息工程学院学生姓名章飞导师姓名齐勇专业计算机科学与技术毕业时间 2016-7 课题名称基于CUDA的卷积神经网路算法实现计划完成初稿时间 2016年5月计划定稿时间 2016年6月立题依据 1、卷积神经网络和CUDA介绍 1）卷积神经网络是目前机器学习领域的热点，因为其网络结构与视觉神经系统中的感受野相似，因此尤为适合处理图像方面的任务。虽然卷积神经网络在准确度等方面有着不错的表现，但在实际运用时不可避免会遇到输入数据量过大，网络层数过大，导致运算速度慢的问题，即使是当前最先进的CPU，其消耗的时间也都是不可接受的。 2）近几年GPU通用并行技术得到了飞速的发展，因为其计算核心的数量远远多于CPU，在高度并行的计算问题上，GPU的计算效率要远高于CPU。CUDA是由英伟达公司推出的GPU通用并行计算平台，不仅提供了一系列API使得开发人员能够绕过GPU的图形API来直接访问GPU的硬件，还提供了一个C语言编译器，使得开发人员能够使用C语言来进行快速的开发。基于CUDA的代码就可以运行在GPU上，使得卷积神经网络算法在GPU上的开发成为可能。 2、国内外发展状况 1)在国外，早在1989年，加拿大多伦多大学教授Yann LeCun就提出了卷积神经网络，它是一种包含卷积层的深度神经网络模型。通常一个卷积网络架构包含两个可以训练产生的非线性卷积层，两个固定的子采样层和一个全连接层，隐藏层的数量一般至少五个以上。但这在图像识别问题上并没有取得质的提升和突破，直到2012年Hinton构建的深度神经网络才取得惊人的成果。这主要是因为对算法的改进，在网络的训练中引入了权重衰减的概念，有效的减小了权重幅度，防止网络过拟合。更关键的是计算机能计算力的提升，GPU加速技术的发展，这使得在训练过程中可以产生更多的训练数据，使得网络能够更好地拟合训练样本。 2)在国内，2012年百度公司将卷积神经网络等技术成功应用到人脸识别和自然图像识别问题，并推出了相应的产品。现在深度学习网络模型已能够理解和识别一般的自然图像。深度学习模型不仅大幅度提高了图像识别的精度，同时也避免了需要消耗大量的时间进行人工特征提取的工作，使得在线运算效率大大提升。总的来看，现阶段，随着互联网行业的高速发展，往往面对的是海量的数据，如何利用现有的并行计算平台进行大规模样本数据训练是各个进行深度学习研发公司首要解决的难题，如何能在普通的个人电脑上运用并行的思想处理更多实际应用中的大型计算问题，传统的深度网络训练速度慢慢无法满足互联网应用的需求。 3、研究目的、意义研究目的：构建基于CUDA架构的编程环境，实现卷积神经网络算法，利用GPU的高度并发性能，提高卷积神经网络训练数据的速度，使得普通的个人电脑就能处理更多实际应用中的大型计算问题。研究意义：基于CUDA的卷积神经网络算法的实现，加快了大规模数据的训练速度，这在现阶段互联网飞速发展，需要处理海量数据的情况下具有重要的意义，采用并行计算的思路提高卷积神经网络的速度，使其具备实用性。普通用户的个人机就能使用该加速算法所使用的加速硬件，通过计算机CUDA将卷积神经网络算法映射到GPU，在获得较高准确率的同时，也对训练和预测过程进行了加速，也为普通用户提供了一种可行的解决方案。通过本次毕业设计的基于CUDA的卷积神经网络算法的实现，来提高自己的学习能力、发现问题、分析问题、解决问题能力。同时，增加对现今的常用的模式识别、搜索排行优化等技术背后的机器学习知识的了解，增强对所学知识的应用能力。对CUDA技术,以及C++的灵活应用能力都会有很大提升，对算法的设计和实现都会有一个更深的理解和掌握。二、研究内容 1、研究内容 1) 掌握卷积神经网络的原理。 2) 掌握使用CUDA设计并行程序。 3）数据预处理模块，Solver模块、Net模块、Layers模块，基础函数模块，JSON数据读取模块，内存管理模块的设计。 5) 研究卷积神经网络算法并行化实现。 2、设计方案 1）卷积神经网络算法模块图如图2-1 图2-1卷积神经网络算法模块图 2）卷积神经网络结构如图2-2 设计卷积神经网络算法的CPU和GPU实现，画出准确度-时