- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
线性回归模型主要内容1.1模型结构和假设1.21.3参数估计1.4异方差与加权最小二乘估计1.5假设检验1.6模型诊断和改进1.7模型的评价与比较1.8()1.1模型结构和假设()1.1模型结构和假设假设我们感兴趣的变量是,希望建立它与其他个解释变量之间的函数关系。最一般的函数形式可以表示为:式中是随机误差。在线性回归模型中,设是一个线性函数,可得线性回归模型为:如果对因变量和解释变量有n次观测,第i次观测值记为和则相应的线性回归模型可以表示为:()为方便起见,线性回归模型可以表示为矩阵形式:式中,()基本假设(1)误差项的均值为零,且与解释变量相互独立,即(2)误差项独立同分布,即每个误差项之间相互独立且每个误差项的方差都相等:(3)解释变量之间线性无关(4)正态假设,即假设误差项服从正态分布:在上述假设下,可得:()1.2解释变量()1.2解释变量分类解释变量如果解释变量是分类变量,在建模过程中需要把分类解释变量转化为虚拟变量。为避免解释变量之间出现完全共线性,虚拟变量个数等于分类变量的水平数减去1。()Exle:车型是一个分类解释变量,有A,B,C,D四个水平,可以转化为x1,x2,x3三个虚拟变量,定义如下表所示:车型x1x2x3A100B010C001D000()假设车型是模型中唯一的解释变量,则线性回归模型的拟合值表示为:根据模型,可以求得不同车型条件下对因变量的拟合值为:在模型中,车型D是基准水平,也称参照水平。为了预测结果的稳定性,通常选择观测值较多的水平为基准水平。在R中的实现:type=factor(c(A,B,C,0D))model.matrix(~type)车型=A车型=B车型=C车型=D()交互效应交互效应是指一个解释变量对因变量的影响与另一个解释变量有关。譬如,不同性别的驾驶人,其年龄对索赔频率的影响是不同的,即年龄和性别之间存在交互效应。()变量的标准化为了消除量纲的影响,可以考虑对变量进行标准化处理,即:式中,()Exle:表示汽车保险的索赔频率;表示驾驶人的年龄,是一个连续变量;表示性别,是一个虚拟变量,值为0表示男性,1表示女性;表示年龄和性别的交互效应;则线性回归模型的拟合值可以表示为:在模型中,年龄每增加一单位,对索赔频率拟合值的影响是一个跟性别有关的值,即:()基于标准化以后的数据建立的回归模型为:回归系数间有下述关系:标准化回归系数的绝对值大小度量了解释变量的相对重要性,值越大,表明该解释变量对因变量的影响越大。在R中,用scale(data)实现标准化()变量变换解释变量与因变量之间如果是非线性关系,可以考虑对解释变量进行变换或建立多项式回归模型。多项式回归是把一个解释变量的幂变换作为新的解释变量引入回归模型。为简化表述,不妨假设只有一个原始解释变量,则m次多项式回归模型的基本形式如下:所以多项式回归也属于线性回归模型。()在普通多项式回归中,多项式的阶数不同,参数估计结果也不同。为了克服这种缺陷,可以使用正交多项式回归模型,即把原来的解释变量转化为新的正交解释变量。譬如,三阶正交多项式回归模型为表示为:()在R中的实现:set.seed(10)x=1:20y=2+x+x^2+runif(20)*50mod1=lm(y~x)mod2=lm(y~poly(x,2))mod3=lm(y~poly(x,19))plot(y~x,yaxs=i,pch=19,ylim=c(0,500),xlim=c(0,21),xaxs=i,las=1)abline(mod1)points(x,fitted(mod2),col=2,type=l,lty=4,pch=)points(x,fitted(mod3),col=4,type=l,lty=5,pch=)legend(1,450,c(一元线性回归,二次多项式回归,19次多项式回归),lty=c(1,2,3),col=c(1,2,4))()()如果解释变量取值较大,多项式模型中高次项可能会导致计算溢出,从而使得对其参数的估计值出现下溢。解决这一问题
您可能关注的文档
- 技术人员绩效管理.ppt
- noip计算机基础探讨.ppt
- 弹塑性力学讲义.pptx
- 计算方法—插值法.ppt
- MATLAB经典教程教学.ppt
- 商业模式课件.pptx
- 职业生涯管理.ppt
- 离散数学教程.ppt
- 涉江采芙蓉诗三首.ppt
- 大资管市场概述.ppt
- 中国国家标准 GB 14287.5-2025电气火灾监控系统 第5部分:测量热解粒子式电气火灾监控探测器.pdf
- 《GB/T 42706.4-2025电子元器件 半导体器件长期贮存 第4部分:贮存》.pdf
- GB/T 42706.4-2025电子元器件 半导体器件长期贮存 第4部分:贮存.pdf
- 中国国家标准 GB/T 42706.4-2025电子元器件 半导体器件长期贮存 第4部分:贮存.pdf
- 中国国家标准 GB/T 19436.2-2025机械电气安全 电敏保护设备 第2部分:使用有源光电保护装置(AOPDs)设备的特殊要求.pdf
- 《GB/T 19436.2-2025机械电气安全 电敏保护设备 第2部分:使用有源光电保护装置(AOPDs)设备的特殊要求》.pdf
- 《GB 27898.4-2025固定消防给水设备 第4部分:消防气体顶压给水设备》.pdf
- GB 27898.4-2025固定消防给水设备 第4部分:消防气体顶压给水设备.pdf
- GB/T 31270.1-2025化学农药环境安全评价试验准则 第1部分:土壤代谢试验.pdf
- 中国国家标准 GB/T 31270.1-2025化学农药环境安全评价试验准则 第1部分:土壤代谢试验.pdf
最近下载
- ISO--14644-1-2015-中文版本文档.pdf VIP
- 氧化铝公司基建施工验收手册.doc VIP
- 2025重庆永川区来苏镇关于村社区专职干部招录8人备考题库完美版.docx VIP
- 北京外国语大学《大学英语》2003年真题.docx VIP
- 2025重庆永川区来苏镇关于村社区专职干部招录8人备考题库汇编.docx VIP
- 新高一必修1第四单元课文+翻译 .pdf VIP
- 华为内部控制手册.pdf VIP
- 全国翻译专业资格(水平)考试--CATTI精品课件.ppt VIP
- HJ 169-2018 建设项目环境风险评价技术导则.docx VIP
- 浙江专升本英语真题 铭远教育 2014年浙江专升本英语真题.doc VIP
原创力文档


文档评论(0)