- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
摘要
摘 要
深度学习已经成为人工智能领域内的一种重要技术,并且成功应用于计算机
视觉、自动驾驶、物联网、智能机器人等关键领域。在深度学习中,深度模型的
训练过程是一个重要任务,该过程可以看成一个优化问题。所以,很多优化算法
被应用于模型训练任务中。其中,随机梯度优化算法是一种广泛应用于深度模型
训练的算法。但是随机梯度优化算法的收敛速度缓慢,为了克服这一问题,很多
学习率自适应的优化算法被提出,这些自适应优化算法显著的加快了收敛速度。
然而,当前日益复杂的应用环境给深度学习带来了高维、海量的数据,这使得深
度模型的训练任务更加困难。因此,应用于深度模型训练的优化算法应该具有易
于实现、收敛速度快、计算成本低等特点。
目前,易于实现且收敛速度快的优化算法大部分是基于随机梯度的自适应优
化算法。然而,这些优化算法在处理深度学习的训练任务时,存在两个导致计算
成本过高的因素:1 这些优化算法每次迭代时都会计算决策变量的全坐标梯度,
因此在模型训练过程中产生了高昂的计算成本;2 深度模型的训练往往是一个
受限优化问题,而随机梯度自适应优化算法在处理它们时都会计算高阶的投影距
离 (投影算子),所以投影算子给训练过程带来了巨大的计算成本。为了解决以
上两个问题,从而减少深度模型训练的计算成本,本文将完成以下研究内容:
(1) 针对一种流行的自适应随机梯度算法 (称为 Adam 算法)的全坐标梯度
计算问题,提出了一种随机坐标块 Adam 算法,该算法利用随机坐标块方法减少
了大量的计算成本。通过理论分析证明了该算法是收敛的,且具有 的后悔
界 (其中 为迭代次数,下同),并利用在公开数据集上进行的仿真实验验证了
理论分析的结果。
(2) 针对一种具有动态学习率的自适应随机梯度算法 (称为 AdaBound 算法)
的全坐标梯度计算问题,提出了一种随机坐标块 AdaBound 算法,该算法利用随
机坐标块方法减少了每次迭代的计算成本。通过理论证明分析了该算法的收敛性,
且得到其后悔界为 ,并通过仿真实验验证了收敛性证明的结果。
(3) 针对随机梯度优化算法在深度模型训练过程中产生的投影算子问题,提
出了一种无投影 Adam 算法,该算法利用 Frank-Wolfe 方法将高阶的投影距离计
算替换成一维线性搜索,从而避免了成本高昂的投影算子。通过理论证明分析了
该算法的收敛性,且得出其后悔界为 ,并利用公开数据集上的仿真实验
验证了证明结果。
(4) 针对随机梯度优化算法的全坐标计算和投影算子问题,提出了一种无投
I
摘要
影随机坐标块算法,该算法成功应用于分布式深度学习中的子模最大化问题,利
用随机坐标块方法和 Frank-Wolfe 方法避免了决策变量的全梯度计算和投影算子,
从而很大程度的减少了计算成本。通过理论分析证明了该算法的收敛性,并得出
其能在有限的 次迭代内得到紧近似值 ,且利用公开数据集
上进行的仿真实验验证了证明结果。
本文主要研究深度学习中随机梯度优化理论。针对深度模型训练过程中的高
昂计算成本问题,利用随机坐标块方法和 Frank-Wolfe 方法避免了大量的计算成
本,提出了四种不同的随机梯度自适应优化算法,且均在理论上进行了证明,并
在主流的公开数据集上取得了良好性能。
关 键 词:深度学习;优化算法;凸优化;在线优化;随机梯度
论文类型:基础研究
选题来源:国家自然科学基金项目
II
您可能关注的文档
- 准双曲面--圆柱二级齿轮减速箱声辐射分析及减振技术研究.pdf
- 弥散铜_(W, Cr)电触头材料的组织与性能.pdf
- 力学性能对模具钢冲击磨损行为的影响.pdf
- 视觉识别系统指导下的渑池县四龙庙村景观设计.pdf
- RV减速器针齿壳的成形磨削工艺参数优化及提高磨齿精度研究.pdf
- 基于“慢生活”理念下的洛阳云栖谷休闲农业园总体规划.pdf
- 青蒿素对柔嫩艾美耳球虫感染鸡盲肠组织和免疫功能的影响.pdf
- 低速重载关节轴承表面涂层结构优化及磨损机理分析.pdf
- 滨水景观生态设计策略研究--以郑州凤河滨水公园B区景观设计为例.pdf
- Cu--Ni--Si--Co合金的时效特性和热变形行为研究.pdf
- 2015年国家公务员录用考试《行测》真题(地市级国考试卷)附答案详解(培优a卷).docx
- 2007年国家公务员考试《行测》真题卷及答案详解(历年真题).docx
- 2024年国家公务员录用考试《行测》真题(地市级)附参考答案详解(黄金题型).docx
- 2014年国家公务员录用考试《行测》真题及参考答案详解【综合卷】.docx
- 2023年国家公务员录用考试《行测》题(副省级)含完整答案详解【历年真题】.docx
- 2024年国家公务员录用考试《行测》真题(行政执法)(精练)附答案详解.docx
- 2021年国家公务员录用考试《行测》题(副省级)【word】附答案详解.docx
- 2002年国家公务员录用考试《行测》真题(B卷)及完整答案详解【典优】.docx
- 2023年国家公务员录用考试《行测》题(副省级)带答案详解(实用).docx
- 2008年国家公务员录用考试《行测》题【必刷】附答案详解.docx
原创力文档


文档评论(0)