- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
回归分析的基本思想及其初步应用(展示课)
对于给定样本点 两个含有未知参数的模型 其中a,b是未知参数 比较两个拟合效果的步骤 比较两个拟合效果的步骤 回归分析基本思想及其初步应用 基本思想 实际应用 回归分析 相关性方法分析 回归优劣分析 总偏差平方和 残差平方和 回归平方和 小结 回归分析的步骤 画散点图 求回归直线方程 用回归直线方程进行预报 函数关系是一种确定性关系 相关关系是一种非确定性关系 回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法. 称为样本点的中心 对于一组具有线性相关关系的数据 (x1,y1),(x2,y2),…,(xn,yn) 回归方程的最小二乘估计公式 截距 斜率 与?,?无关 ≥0 例1 从某大学中随机选取8名女大学生,其身高和体重数据如下表 编号 1 2 3 4 5 6 7 8 身高/cm 165 165 157 170 175 165 155 170 体重/kg 48 57 50 54 64 61 43 58 求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为172cm的女大学生的体重. 画散点图 求回归直线方程 用回归直线方程进行预报 解 取身高为自变量x,真实体重为因变量y 作散点图 可用线性回归方程刻画它们之间的关系 根据公式可得 回归方程为 所以,对于身高172cm的女大学生,由回归方程可以得到预报其体重 r0时,表明两个变量正相关; r0时,表明两个变量负相关. 相关系数r衡量两个变量间线性相关关系的方法 r的绝对值越接近1,表面两个变量的线性相关性越强; r的绝对值越接近0,表面两个变量之间几乎不存在线性相关关系. 当r0.75时认为两个变量有很强的线性相关关系 身高172cm的女大学生体重一定是60.316kg吗? 样本点散布在某一条直线附近 用y=bx+a+e表示身高和体重的关系 y=bx+a+e a和b为模型的未知参数 e是y与 随机误差, E(e)=0, D(e)=?20 ?2越小 线性回归模型 随机误差e 产生随机误差e的原因是什么? 一个人的体重值除了受身高的影响外, 饮食 运动 还有 度量误差 线性模型只是近似模型 怎样研究随机误差?如何衡量预报的精度? 随机变量数字特征 所以用方差?2来衡量随机误差的大小 均值 反映随机变量取值平均水平 方差 反映随机变量集中于均值程度 因E(e)=0 根据样本的估计值来估计?2 残差 残差平方和 根据截距和斜率的估计公式,建立回归方程 对于样本点 相应的随机误差为 衡量回归方程的预报精度;其越小,预报精度越高. 残差分析 根据散点图来粗略判断它们是否线性相关,是否可以用线性回归模型来拟合数据 通过残差来判断模型按惯例的效果,判断原始数据中是否存在可疑数据. 编号 1 2 3 4 5 6 7 8 身高/cm 165 165 157 170 175 165 155 170 体重/kg 48 57 50 54 64 61 43 58 残差_ -6.373 2.627 2.419 -4.618 1.137 6.627 -2.883 0.382 女大学生身高体重原始数据和相应的残差数据表 利用图形分析 如残差比较均匀地落在水平的带状区域中,说明选用的模型比较合适.带状区域宽度越窄,模型拟合精度越高,回归方程的预报精度超高. 利用相关指数R2来刻画回归的效果 R2越接近于1,表示回归的效果越好 R2取值越大,表示残差平方和越小,模型的拟合效果越好. 用身高预报体重时,需要注意下列问题: 回归方程只适用于我们所研究的样本总体. 所建立的回归方程一般都有时间性. 样本取值的范围分影响回归方程的适用范围. 不能期望回归方程得到的预报值就是预报变量的精确值.而是可能取值的平均值 建立回归模型的基本步骤 确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量; 画出确定好的解释变量和预报变量的散点图,观察它们之间的关系; 由经验确定回归方程的类型; 按一定规则估计回归方程中的参数; 得出结果后分析残差图是否有异常,若存在异常,则检查数据是否有误,或模型是否合适. 例2 一只红铃虫的产卵数y各温度x有关.现收集了7组观测数据列于下表中,试建立y与x之间的回归方程. 温度x/℃ 21 23 25 27 29 32 35 产卵数y/个 7 11 21 24 66 115 325 解 作出散点图 令z=lny 样本点分布在直线 z=bx+a (a=lnc1,b=c2) 建立y和x的非线性回归方程 x 21 23 25 27 29 32 35 z 1.946 2.398 3.045 3.178 4.190 4.745 5.784 变换后的样本数据及其散点图 得到线性回归方程为 红铃虫的产卵数对温度的非线性回归方程为 令t=x2, 得y与x之间的非线性回归方程 t 441
原创力文档


文档评论(0)