- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
C5层: 输入图片大小: (5*5)*16 卷积窗大小: 5*5 卷积窗种类: 120 输出特征图数量: 120 输出特征图大小: 1*1 (5-5+1) 神经元数量: 120 (1*120) 连接数: 48120 [16*(5*5)+1]*1*120(全连接) 可训练参数: 48120 [16*(5*5)+1]*1*120 F6层: 输入图片大小: (1*1)*120 卷积窗大小: 1*1 卷积窗种类: 84 输出特征图数量: 84 输出特征图大小: 1 神经元数量: 84 连接数: 10164 120*84(全连接) 可训练参数: 10164 120*84 OUTPUT层: 输入图片大小: 1*84 输出特征图数量: 1*10 最后,输出层有10个神经元,是由径向基函数单元(RBF)组成,输出层的每个神经元对应一个字符类别。RBF单元的输出 ,是由公式: 卷积神经网络的衰落 在很长时间里,CNN虽然在小规模的问题上,如手写数字,取得过当时世界最好结果,但一直没有取得巨大成功。这主要原因是,CNN在大规模图像上效果不好,比如像素很多的自然图片内容理解,所以没有得到计算机视觉领域的足够重视。 深度学习的崛起 2012年10月,Geoffrey Hinton和他的两个学生在著名的ImageNet问题上用更深的CNN取得世界最好结果,使得图像识别大踏步前进。在Hinton的模型里,输入就是图像的像素,没有用到任何的人工特征。 深度学习在图像识别中的应用 2012年6月,《纽约时报》披露了Google Brain项目,吸引了公众的广泛关注。这个项目是由著名的斯坦福大学的机器学习教授Andrew Ng和在大规模计算机系统方面的世界顶尖专家Jeff Dean共同主导,用16,000个CPU Core的并行计算平台去训练含有10亿个节点的深度神经网络(DNN,Deep Neural Networks),使其能够自我训练,对2万个不同物体的1,400万张图片进行辨识。 在开始分析数据前,并不需要向系统手工输入任何诸如“脸、肢体、猫的长相是什么样子”这类特征。Jeff Dean说:“我们在训练的时候从来不会告诉机器:‘这是一只猫’(即无标注样本)。系统其实是自己发明或领悟了‘猫’的概念。” 2014年3月,同样也是基于深度学习方法,Facebook的?DeepFace?项目使得人脸识别技术的识别率已经达到了?97.25%,只比人类识别?97.5%?的正确率略低那么一点点,准确率几乎可媲美人类。该项目利用了?9?层的神经网络来获得脸部表征,神经网络处理的参数高达?1.2亿。 这个惊人的结果为什么在之前没有发生? 原因当然包括算法的提升,比如dropout等防止过拟合技术,但最重要的是,GPU带来的计算能力提升和更多的训练数据。百度在2012年底将深度学习技术成功应用于自然图像OCR识别和人脸识别等问题,并推出相应的桌面和移动搜索产品,2013年,深度学习模型被成功应用于一般图片的识别和理解。 从百度的经验来看,深度学习应用于图像识别不但大大提升了准确性,而且避免了人工特征抽取的时间消耗,从而大大提高了在线计算效率。可以很有把握地说,从现在开始,深度学习将取代“人工特征+机器学习”的方法而逐渐成为主流图像识别方法。 总结 ANN(人工神经网络)又被称为浅层神经网络(shallow neural network,也可能使用了CNN的方法。 CNN(卷积神经网络)其实是已经很早提出来的理论,也得到了在字母识别数字识别上的好的运用,letnet-5。 DNN(深度神经网络)可近似为深度卷积神经网络(CNNs),将卷积神经网络的深度大大加深。 总结 当下研究的热门是用更深层次的卷积神经网络模型用于图像和语音识别。难点在于训练使模型收敛。 Hinton在12年ImageNet能使错误率大大降低的关键不仅仅是增加了卷积神经网络的深度,而之所以能训练深层次的网络使其达到收敛,原因是改进了卷积神经网络的训练方式(ReLU+Dropout)。 Hinton在2012年发表的关于图像处理的文章: imagenet-classification-with-deep-convolutional-neural-networks “ ” “ ” Convolutional Neural Networks 卷积神经网络 主要内容 卷积神经网络—诞生背景与历程 卷积神经网络应用—LeNet-5手写数字识别 深度学习—Hinton做了些什么 深度学习在数字图像识别上的运用 —Hinton如何在2012年ImageNet引起轰动 卷积神经网络提出的背景 浅层神经网络 大约二三十年前,
您可能关注的文档
最近下载
- 在线网课知道智慧《薪酬管理(海南大学)》单元测试考核答案.pdf VIP
- 人教A版数学高中选择性必修一《3.1.1椭圆及其标准方程》教学设计.docx VIP
- 2023年郴州市苏仙区事业单位真题及答案.pdf VIP
- 钢结构工程施工质量验收标准(GB 50205-2020)(2).docx VIP
- 剧本杀三人本文档.pdf VIP
- ABB AC800M基础培训课件——硬件hardware.ppt VIP
- 竞聘中小学校长面试题及答案.doc VIP
- 現代设计史复习资料.doc VIP
- GB50169-2016 电气装置安装工程接地装置施工及验收规范附条文.docx VIP
- 《深度学习 》课件 第8章-注意力机制.pptx
文档评论(0)