- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
假设两个物理量之间满足线性关系,其函数形式可写为 y=a+bx。 a.一元线性回归及最小二乘法的原理 现由实验测得一组数据 式中a、b是要用实验数据确定的常数,此类方程叫线性回归方程,待定常数a、b叫线性回归系数。 * * 由于实验数据总是存在着误差,所以把各组数据代入y=a+bx时,两边并不相等,作图时,数据点也不能准确地落在公式对应的直线上,如图所示,从中还可看出第i个数据点与直线的偏差为 a.一元线性回归及最小二乘法的原理 * * * * * * * O x Vi Y * * a.一元线性回归及最小二乘法的原理 纵向距离是y的实际值与拟合值之差,差异大拟合不好,差异小拟合好,所以又称为拟合误差或残差。 将所有纵向距离平方后相加,即得误差平方和,“最好”直 线就是使误差平方和最小的直线。 于是可以运用求极值的原理,将求最好拟合直线问题转换为求 误差平方和最小。 * * 设拟合直线方程: 0 y yi x y=a+bx xI 最小二乘拟合法 小结:最小二乘法拟合 y=a+bx 若实际校准测试点有n个,则第i个校准数据与拟合直线上响应值之间的残差为 最小二乘法拟合直线的原理就是使 为最小值,即 对a和b一阶偏导数等于零,求出a和b的表达式 * * 具体过程分析:一元线性回归(直线拟合) 函数形式 (1) 实验数据为 由于x和y的测量存在误差,将 代入(1)式,等式两边并不相等。 等式两端的差值用 表示,则 …... * * 按最小二乘法原理,a、b最佳值应满足: (2) 由于 最小, (2)式对a和b求偏导应为0。 整理后得 (3) * * 由于 代入(3)式有: * * 为了计算方便,引入符号: * * * * 总结经验公式时,我们初步判断所假定的函数关系是否正确?为了解决这些问题,就需要讨论回归方程的精度和相关性。为了估计回归方程的精度,进一步计算数据点(xi ,yi)偏离最佳直线y=a+bx的大小,我们引入概念—剩余标准偏差,它反映着回归方程与各数据点的拟合程度。 b. 回归方程的精密度和相关系数 最小二乘法确定a,b有没有误差? 斜率 截距 测量值 * * 相关系数r 定量描述x、y变量之间线性相关程度的好坏(寻找经验公式用) (2)r=0时, 即y与x无线性关系,说明数据点的分布规律非线性。 r0,拟合曲线斜率为正,r0 斜率为负。 (3)r=±1时, Sy=0,即各数据点与最佳直线完全重合, x,y 完全线性相关。 (4) 0r1时,各数据点与最佳直线不完全重合。有两种情况: 讨论: (1) r称为相关系数。其值可正可负,一般有 * * 一种可能是各数据点与该线偏差较小,一种可能是各数据点与该线偏差较大。 一般来说数据点就越靠近最佳直线两旁。两变量间的关系线性相关,可以认为是线性关系,最佳直线所反应的函数关系也越接近两变量间的客观关系。同时还说明了测量的精密度高。 根据数据点的分布,也许能得到一条“最佳”直线。然而,数据点与“最佳”直线的偏差过大。如图所示。这时“最佳”二字只能说明数据点距这直线的总偏差较小,但不能反映出数据点的分布规律。或者说,我们事先的初步判断是错误的,数据点的分布规律不是线性的,根本就不能用一条直线表示。 * * 由上述分析可知,Sy的数值表明了线性回归方程的精密度,或者,形象地说,描绘了回归线的“宽度”。可以证明,数据点落在 范围内的机会是99.7%,按照多次直接测量中讨论的相同标准,也可判别其是否有粗差,要否剔除。(参考p12的3σ准则,复习见ppt下页) O x Y * * * * * * * * * * 3Sy * * * * ?测量列中坏值的剔除 拉依达准则(3σ准则):以3σ为置信限(概率为99.7%),凡 超过此值的偏差均看作粗差,与之 相应的测量值为坏值,应剔除。 肖维涅准则:此准则规定误差出现的概率小于1/2n时,认为与
文档评论(0)