- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
研究生专业课程考试答题册
得分:
学 号
姓 名
考试课程 人工神经网络及其应用
考试日期
西北工业大学研究生院
基于AlexNet的图像分类
近几年,随着深度学习的崛起,越来越多的科研工作者开始使用深度学习的方法进行实验,并且取得了非常不错的成绩。目前,深度学习算法主要应用在语音识别、图像识别以及自然语言处理领域。本文根据所给的训练样本,选取深度学习方法进行图像分类。
图像分类
1.1传统方法
图像分类是机器视觉中的一个基本问题。针对这一问题的模型框架主要包括图像预处理、图像特征提取、分类器设计三个步骤。其中特征提取是生成图像表示的过程,也是图像分类中最重要的一步,鲁棒的特征表示是提高分类正确率的关键。关于图像表示,相关学者提出了许多特征表示法,例如基于部位模型[1]、BOW[2]模型等等,在这些模型当中,BOW模型的鲁棒性最强,具有尺度不变性、平移不变性以及旋转不变性等优点,使其在实际问题中得到广泛应用,包括图像分类、图像标注、图像检索以及视频事件检索等,并且在Caltechl01等库中取得很好的分类效果。
1.2卷积神经网络模型
在传统的图像分类方法中,首先对原始图片进行预处理,然后根据BOW最后选择合适的分类器进行分类,如图1.1所示。然而,在传统方法中,特征都是人为设计的,包括底层特征的选择、码本长度的设置、编码策略的设计、池化方法的选择以及空间金字塔区域的划分形式等,这些人为因素对特征产生很大的影响,目前没有理论上的公式给出最优的设计因素组合,所以只能从经验上进行判别和设计,降低了特征的表达能力和可靠性,并且针对不同的数据库,需要重新设计以上因素,导致传统特征模型的通用性不强,关于特征的表达能力也未能给出理论上的估计。
图1.1传统分类与卷积神经网络分类模型
如图1.1所示,在卷积神经网络中,直接输入原始图像,在网络的最后一层加上分类器,根据分类器的预测结果使用反馈传播(Back Propagation,BP)算法更新权值参数,最后得到的网络模型能够自动学习给定数据集的样本特征。所以,与传统图像分类模型不同,CNN是一个特征学习模型,从原始图像到类别预测整个过程都是自动训练和学习的过程,不需要人为参与和设计,具有很强的鲁棒性和表达能力,在图像分类中的性能远远超过SIFT和HOG等传统特征。
在模式分类中,为了获得非线性的、自适应的、自组织的识别系统,美国心 理学家麦卡洛克(W.McCulloch)和数学家皮茨(W.Pitts)最早使用数学模型对人脑神经系统中的神经元建模,提出神经网络数学模型的概念;随后,美国计算机科学家罗森布拉特(F.Rosenblatt)最早于1957年提出感知机模型,使用阈值激活函数,并在神经网络数学模型中引入学习和训练的概念和功能,通过连续调节和更新网络的权值参数来学习网络模型;到1959年,美国的威德罗(B.Widrow)和霍夫(M.Hom)提出自适应线性元件,对每个神经元使用线性激活函数,并采用W-H 学习规则训练权值,从而得到比感知机更低的测试误差以及更快的收敛速度;到了1986年,美国的心理学家麦克利兰(McClelland)和人工智能专家鲁梅尔哈特 (Rumelhart)提出了经典的反馈传播神经网络模型,即BP神经网络模型,使用误差反传和梯度下降法逐层更新网络的权值参数,从而逼近任意的非线性可微函数, 实现模式识别、函数逼近等功能。后来,在人工神经网络的实践应用中,接近80% 到90%的研究工作均采用BP网络模型或者它的变化形式[3]。
尽管选择非线性激活函数以及多层前向网络可以学习复杂的、高度非线性的模型,实现模式识别或分类等功能。但是传统人工神经网络仍然存在很多局限性:第一,参数太多,传统人工神经网络的逐层连接方式均为全连接,每一层都涉及到大量的矩阵乘积运算,参数个数与节点数呈倍数增长,导致传统神经网络模型的参数过多,容易引起过拟合问题,为了防止过拟合,传统神经网络模型的层数一般设置的很少,限制了网络深度的增长和网络学习能力的增强;第二,局部极小值问题突出,训练传统人工神经网络模型的方法中,并没有提出良好的参数初始化策略,导致网络收敛到局部极小值的问题比较突出;第三,训练过程缓慢,BP网络的隐含层通常使用sigmoid或者tanh等激活函数,这些非线性激活函数存在非常广泛的饱和区域,当神经元输入值落于函数的饱和区时,得到的函数导数值非常小,使得训练过程中,根据梯度下降法更新的网络权值基本不变,从而出现神经元“麻痹”的现象,导致训练过程非常缓慢
针对传统神经网络存在的问题,在图像分类中,引入卷积神经网络模型。与 统神经网络模型相同,CNN模型是由多个网络层以有向无环图形式连接而成的网络结构,
原创力文档


文档评论(0)