- 1、本文档共33页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
浅谈神经网络
浅谈神经网络
先从回归(Regression)问题说起。我在本吧已经看到不少人提到如果想实现强AI,就必须让机器学会观察并总结规律的言论。具体地说,要让机器观察什么是圆的,什么是方的,区分各种颜色和形状,然后根据这些特征对某种事物进行分类或预测。其实这就是回归问题。?如何解决回归问题?我们用眼睛看到某样东西,可以一下子看出它的一些基本特征。可是计算机呢?它看到的只是一堆数字而已,因此要让机器从事物的特征中找到规律,其实是一个如何在数字中找规律的问题。?例:假如有一串数字,已知前六个是1、3、5、7,9,11,请问第七个是几?你一眼能看出来,是13。对,这串数字之间有明显的数学规律,都是奇数,而且是按顺序排列的。那么这个呢?前六个是0.14、0.57、1.29、2.29、3.57、5.14,请问第七个是几?这个就不那么容易看出来了吧!我们把这几个数字在坐标轴上标识一下,可以看到如下图形:用曲线连接这几个点,延着曲线的走势,可以推算出第七个数字——7。由此可见,回归问题其实是个曲线拟合(Curve Fitting)问题。那么究竟该如何拟合?机器不可能像你一样,凭感觉随手画一下就拟合了,它必须要通过某种算法才行。
假设有一堆按一定规律分布的样本点,下面我以拟合直线为例,说说这种算法的原理。?其实很简单,先随意画一条直线,然后不断旋转它。每转一下,就分别计算一下每个样本点和直线上对应点的距离(误差),求出所有点的误差之和。这样不断旋转,当误差之和达到最小时,停止旋转。说得再复杂点,在旋转的过程中,还要不断平移这条直线,这样不断调整,直到误差最小时为止。这种方法就是著名的梯度下降法(Gradient Descent)。为什么是梯度下降呢?在旋转的过程中,当误差越来越小时,旋转或移动的量也跟着逐渐变小,当误差小于某个很小的数,例如0.0001时,我们就可以收工(收敛, Converge)了。啰嗦一句,如果随便转,转过头了再往回转,那就不是梯度下降法。?我们知道,直线的公式是y=kx+b,k代表斜率,b代表偏移值(y轴上的截距)。也就是说,k可以控制直线的旋转角度,b可以控制直线的移动。强调一下,梯度下降法的实质是不断的修改k、b这两个参数值,使最终的误差达到最小。?求误差时使用 累加(直线点-样本点)^2,这样比直接求差距 累加(直线点-样本点) 的效果要好。这种利用最小化误差的平方和来解决回归问题的方法叫最小二乘法(Least Square Method)。?问题到此使似乎就已经解决了,可是我们需要一种适应于各种曲线拟合的方法,所以还需要继续深入研究。?我们根据拟合直线不断旋转的角度(斜率)和拟合的误差画一条函数曲线,如图:?从图中可以看出,误差的函数曲线是个二次曲线,凸函数(下凸, Convex),像个碗的形状,最小值位于碗的最下端。如果在曲线的最底端画一条切线,那么这条切线一定是水平的,在图中可以把横坐标轴看成是这条切线。如果能求出曲线上每个点的切线,就能得到切线位于水平状态时,即切线斜率等于0时的坐标值,这个坐标值就是我们要求的误差最小值和最终的拟合直线的最终斜率。?这样,梯度下降的问题集中到了切线的旋转上。切线旋转至水平时,切线斜率=0,误差降至最小值。?切线每次旋转的幅度叫做学习率(Learning Rate),加大学习率会加快拟合速度,但是如果调得太大会导致切线旋转过度而无法收敛。?注意:对于凹凸不平的误差函数曲线,梯度下降时有可能陷入局部最优解。下图的曲线中有两个坑,切线有可能在第一个坑的最底部趋于水平。?微分就是专门求曲线切线的工具,求出的切线斜率叫做导数(Derivative),用dy/dx或f(x)表示。扩展到多变量的应用,如果要同时求多个曲线的切线,那么其中某个切线的斜率就叫偏导数(Partial Derivative),用?y/?x表示,?读“偏(partial)”。由于实际应用中,我们一般都是对多变量进行处理,我在后面提到的导数也都是指偏导数。
以上是线性回归(Linear Regression)的基本内容,以此方法为基础,把直线公式改为曲线公式,还可以扩展出二次回归、三次回归、多项式回归等多种曲线回归。下图是Excel的回归分析功能。在多数情况下,曲线回归会比直线回归更精确,但它也增加了拟合的复杂程度。直线方程y=kx+b改为二次曲线方程y=ax^2+bx+c时,参数(Parameter)由2个(分别是k、b)变为3个(分别是a、b、c),特征(Feature)由1个(x)变为2个(x^2和x)。三次曲线和复杂的多项式回归会增加更多的参数和特征。前面讲的是总结一串数字的规律,现实生活中我们往往要根据多个特征(多串数字
您可能关注的文档
- 浅析《澎湃新闻》的发展与困境论文新3稿.doc
- 浅析《蜗居》中郭海藻的悲剧性本科论文.doc
- 浅析H&M行业环境与竞争战略.doc
- 浅析《远大前程》中男主人公的成长-本科毕业论文.doc
- 浅析中国民族音乐文化的发展现状及问题-结业论文.doc
- 浅析中国高端白酒市场营销策略.doc
- 浅析中国蓝莓产业发展.doc
- 浅析中小学生心理健康及策略论文.doc
- 浅析中美贸易失衡的原因及影响开题报告.doc
- 浅析中小企业开展会计电算化应注意的问题-毕业论文.doc
- 2025年广西维尼纶集团有限责任公司校园招聘85人公开引进高层次人才和急需紧缺人才笔试参考题库答案详.docx
- 二零二五版英文采购合同范例.docx
- 二零二五年度坟墓墓碑石材运输与配送合同3篇.docx
- 二零二五年度坟墓墓碑石材加工与环保治理合同3篇.docx
- 二零二五年度城市公共安全视频监控合作协议合同范文3篇.docx
- 二零二五年度城市中心公寓租赁合同与房东签订3篇.docx
- 二零二五年度城市公园绿地建设工程施工合作协议书3篇.docx
- 二零二五年度城市公厕智能化管理服务合同3篇.docx
- 男方赌博离婚协议正规范例.docx
- 二零二五年度城市住宅小区燃气安全监管与用户权益保障合同3篇.docx
最近下载
- 07米联客2020版FPGA教程(FT60X篇).pdf
- (完整)混凝土回弹强度自动计算EXCEL表.xls VIP
- 《 房地产企业税制改进政策研究》范文.docx VIP
- 房产抵押合同范本6篇 .pdf VIP
- 工业机器人系统操作员(技师)理论复习考试题库(附答案).docx
- 山东省中小学教师人工智能赋能教学教研线上研修活动单元测试答案.docx VIP
- 变电站水泥电线杆防腐加固工程施工组织设计方案(可编辑).doc VIP
- 第11课 近代职业教育的兴起和发展(教学设计)-【中职专用】《世界历史》.docx
- 关于延长中频炉炉衬寿命的探讨.pdf
- 核心素养导向下的小学科学教学改革研究教学研究课题报告.docx
文档评论(0)