- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
线性回归模型
摘要:建立线性回归模型是建立Y与X的适当的线性回归关系,通过及最小二乘估计和有关的统计推断可以预测未来的数据。
关键词:多元线性回归模型,多元线性回归模型的矩阵表示,及的最小二乘估计,统计推断。
线性回归模型
1、线性回归模型及其矩阵表示
设Y是一个可观测的随机变量,它受到p-1个非随机因素和随机因素的影响。若Y与有如下线性关系:
称此模型为线性回归模型,其中是未知参数(回归系数);是应变量或响应变量;称自变量或回归变量;称为随机误差项并假定是不可观测的随机变量,而Y与是可观测的变量。要建立多元线性回归模型,首先要估计未知参数进行n(np)次独立观测,得到n组数据(样本)
其中相互独立且均服从分布。
令
其中Y称为观测向量,X称为设计矩阵。并假定X为列满秩的,即,是对估计的未知参数商量,是不可观测的随机误差商量。是多元线性回归模型的矩阵形式。
2、参数估计
2.1的最小二乘估计
如果Y与满足线性回归模型侧误差应是比较小的,因此,选择使误差项的平方和
达到最小,其中 ,为此,将分别对求偏导并令其等于零,得
K=0,1,…,P-1
即 K=0,1,…,P-1
矩阵形式是称此方程为正规方程。
因为故存在,解正规方程即得的最小二乘估计为
2.2误差方差的估计
将自变量的名组观测值代入回归方程,可得因变量的各估计值(称为拟合值)为
称
为残差向量,其中为 n阶对称幂等矩阵,I为n阶单位矩阵,称数
为残差平方和(SSE)
注意到且,故
因此可得
其中表示矩阵的迹,从而
为的无偏估计。
3、有关的统计推断
3.1回归关系的统计推断
给定因变量Y与自变量的n组观测值,利用前述方法可得到未知参数和的估计,从而可给出Y与之间的线性回归方程,但所求得的回归方程是否有意义,也就是说Y与之间是否存在显著的线性关系,还需要对回归方程进行检验。
3.1.1 建立方差分析表
我们知道观测值之所以有差异是由下述两个原因引起的,一是当 Y 与之间确定有线性关系时,由于取值的不同,而引起值的变化;另一方面是除去Y 与的线性关系以外的因素,如对的非线性影响及随机因素的影响等,记
则数据的总的离差平方和
反应了数据波动性的大小
残差平方和
反应了数据除去Y与之间的线性关系以外的因素引起的数据的波动。
如果
回归平方和
反应了线性拟合值与它们的平均值的总偏差即由变量的变化所引起的的波动。
若
SSE,SST和 SSR有如下形式的矩阵表示
J表示一个元素全为1的 n 阶方阵。
自由度:自由度是指平方和中独立变化项的数目。由于有一个关系式 即彼此不是独立变化的,故SST的自由度是n-1,SSE的自由度为n-p,SSR的自由度为p-1,它们的自由度关系是:
n-1=(n-p)+(p-1)
方差分析表
方差来源 平方和(SS) 自由度(F) 均方(MS) 回归 p-1 误差 n-p 总和 n-1 利用方差分析表,可对回归方程的显著性做检验。
3.1.2 线性回归关系的显著性检验
为检验Y与之间是否存在显著的线性回归关系,即检验。
假设
给定显著性水平查分布表得临值,计算 F的观测值。
若:
3.2 回归参数的统计推断
回归关系中不一定每个自变量X对Y的影响都显著的。因此,我们对自变量对的显著性关系进行检验。
检验假
的最小二乘估计为
则
而
所以
由于为的无偏估计,从而自然地以
作为的估计。
所以的估计
其中为的全对角线上的第k个元素的平方根,
t(n-p)为自由度为n-p的分布
若: 为真
不真 有偏大的趋势
4、实例
摸公司在各地区销售一种特殊的化妆品,该公司观测了15个城市在某个月内对该化妆品的销售量Y及各地区适合使用该化妆品的人数和人均收入的数据如下。
化妆品销售的调查数据
地区
i 销量
人数(千人)
人均收入(元)
1 162 274 2450 2 120 180 3254 3 223 375 3802 4 131 205 2838 5 67 86 2347 6 169 265 3782 7 81 98 3008 8 192 330 2450 9 116 195 2137 10 55 53 2560 11 252 430 4020 12 232 372 4427 13 144 226 2660 14 103 157 2088 15 212 370 2605 假设误差服从分布,试建立与之间的线性回归方程并研究相应的统计推断问题。
解:我们先看以
您可能关注的文档
- 现代办公空间人性化设计及其发展趋势 毕业论文.doc
- 现代标志设计风格演变趋势的研究 毕业论文.doc
- 现代别墅室外空间设计探析 毕业论文.doc
- 现代财务会计理论及发展趋势 毕业论文.doc
- 现代厨房用品-智能电饭煲-毕业设计.doc
- 现代导示系统中的图形语言来源分析 毕业论文.doc
- 现代的市场营销者应该具备的基本素质 毕业论文.docx
- 现代电喷发动机的故障诊断与维修 毕业论文.doc
- 现代电气消防自动监控系统在楼宇中的实现 毕业论文.doc
- 现代钢结构建筑的美学表现研究 毕业论文.doc
- 未来家居制造:2025年3D打印复合材料编织技术在定制家具中的应用.docx
- 未来海水提碘吸附材料在海洋科技研究中的应用前景.docx
- 未来家居设计:2025年3D打印复合材料编织技术在软体家具中的应用.docx
- 未来工厂2025:智能仓储AGV集群控制技术创新案例研究.docx
- 未来仓储革命:2025年智能AGV调度系统技术革新报告.docx
- 未来交通流预测2025:基于深度学习的智能交通管理技术创新.docx
- 未来剧本杀创作指南:2025年行业规范深度解析.docx
- 未来仓储技术2025:AGV集群控制技术创新与展望.docx
- 未来交通管理2025:智能交通流预测在智能网联汽车中的应用研究.docx
- 未来仓储技术革命:2025年AGV路径规划技术创新应用.docx
文档评论(0)