- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
第四章
汇报人:人工智能专业
线性回归
一元线性回归
PARTONE
相关描述的是变量之间的一种关系。
从统计角度看,变量之间的关系有函数关系和相关关系两种。
函数关系,即当一个或多个变量取一定值时,另一个变量有唯一确定值与之对应。
3
图2-1函数关系
例如,若速度固定,路程和时间之间的关系就是函数关系,如图2-1所示。
4.1.1相关与回归
图2-2相关关系
4
在实际生活中,有些变量之间并不像函数关系那样,有明确的关系,但又的确存在一定的关系。
例如,二手房的房价与面积,这两个变量之间不存在完全确定的关系,但却存在一定的趋势,即面积会对房价有一定影响,但又存在很大的不确定性。通常把变量之间的这种不确定的相互依存关系称为相关关系,如果两个变量之间存在相关关系,则可以用回归方法研究一个变量对另一个变量的影响,如图2-2所示。
4.1.1相关与回归
5
相关分析与回归分析的联系与区别
相关分析与回归分析既有联系又有区别,其联系在于相关分析是回归分析的基础和前提,回归分析是相关分析的深入和继续。其区别主要包含以下3点。
相关分析所研究的两个变量是对等关系,不区分自变量和因变量,而回归分析所研究的两个变量不是对等关系,必须根据研究目的确定其中的自变量和因变量。
对于变量x和y来说,相关分析只能计算出一个反映两个变量间相关密切程度的相关系数,不能估计或推算出具体数值。而回归分析则可以用自变量数值推算因变量的估计值。
相关分析中,两个变量都是随机的,或者一个变量是随机的,另一个变量是非随机的。而回归分析中,自变量是可以控制的变量(给定的变量),因变量是随机变量。
4.1.1相关与回归
线性回归方程使用条件
条件一:回归任务
预测目标(因变量)必须是连续变化的数值
例如:房价、销量、温度等
条件二:相关关系
特征(自变量)与真实值(因变量)存在相关关系
自变量的变化能够影响因变量的变化
条件三:线性关系
自变量与因变量之间的关系大致呈直线趋势
可用直线模型进行拟合和预测
4.1.1相关与回归
房屋价格
房屋面积
线性回归算法基本思想:寻找一条直线,最大程度的拟合样本特征和样本真实值之间的关系
样本特征只有一个:简单线性回归
4.1.2线性回归的原理分析
8
回归是研究一组随机变量与另一组变量之间关系的统计分析方法,通常用y表示因变量,而x被看成是影响y的因素,称为自变量。
线性回归就是运用直线来描述数据之间关系的一种算法。
直线的方程式可以表示为:
4.1.2线性回归的原理分析
9
如果训练样本的数据集中有多个特征变量,则线性回归的一般预测公式为:
4.1.2线性回归的原理分析
10
众所周知,平面上的两个点可以确定一条直线。假设训练数据集中只有两个样本,如表2-2所示。运用这两个样本很容易就可以得到一条拟合直线,如图2-3所示。
表2-2两个样本的训练数据集
序号
x值
y值
1
5
15
2
15
35
4.1.2线性回归的原理分析
11
图2-43个样本的拟合直线
4.1.2线性回归的原理分析
12
4.1.2线性回归的原理分析
13
显然,只要计算出总误差J的最小值,就能找到其对应的直线,求得对应方程的参数,从而找到最合适的线性回归方程。
4.1.2线性回归的原理分析
14
在机器学习中,我们把上述函数J称为损失函数(lossfunction)。
损失函数又称错误函数或J函数,用来对模型的预测误差进行评估。
4.1.2线性回归的原理分析
房屋价格
房屋面积
线性回归的损失函数含义:
每一条红线代表样本点,真实值和预测值的误差,损失函数就是所有红线长度之和
样本特征只有一个:简单线性回归
4.1.2线性回归的原理分析
16
4.1.2线性回归的原理分析
THANKSFORYOURWATCHING
汇报人:人工智能专业
感谢观看
您可能关注的文档
- 第三章平面机构自由度的计算28课件讲解.pptx
- 第三章平面机构自由度的计算43课件讲解.pptx
- 第三章平面机构自由度的计算53课件讲解.pptx
- 第三章平面机构自由度的计算60课件讲解.pptx
- 第三章医学伦理学的基础理论与规范体系65课件讲解.pptx
- 第十一章轴承和联轴器07课件讲解.pptx
- 第十一章轴承和联轴器第一节轴承的分类和结构24课件讲解.pptx
- 第十章第三节轴的结构设计10课件讲解.pptx
- 第四节Maya曲线编辑器的介绍动漫动漫82课件讲解.pptx
- 第四节剪辑3音响剪辑音响可以理解为除了语言音乐之外影片中其他声音的总称音响与语言音乐在微电影作品中是相互交替补充呼应互为结合共同表真表意表情的无论在技术还是艺术上音响都起到烘托影片气氛的作用微电影作品中的音响包括客观性音响和主观性音响两种前者重在写实而后者重在写意因此对剪辑的要求也不尽相同93课件讲解.pptx
- 《2025年养老社区适老化无障碍设施建设人才培养策略》.docx
- 《2025年新能源车环保内饰材料抗过敏与健康安全标准》.docx
- 《2025年充电桩网络发展:城际快充站运营成本控制与收益模式》.docx
- 2026国家管网集团高校毕业生招聘笔试模拟试题(浓缩500题)附参考答案详解(轻巧夺冠).docx
- 《2025年老年护理培训与护工收入水平提升研究》.docx
- 2025年检测机器人行业创新技术及市场应用报告.docx
- 2025年柬埔寨语培训机构教学品牌创新塑造报告.docx
- 2026国家管网集团高校毕业生招聘笔试模拟试题(浓缩500题)附参考答案详解(轻巧夺冠).docx
- 《2025年家用血氧仪产品差异化与健康管理设备行业趋势》.docx
- 2025年婚庆服务行业高端市场拓展策略研究报告.docx
原创力文档


文档评论(0)