- 1、本文档共16页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数学与应用数学线性回归模型精选
线性回归模型
新疆师范大学数理信息学院数学03-6班
摘要:建立线性回归模型是建立Y与X的适当的线性回归关系,通过及最小二乘估计和有关的统计推断可以预测未来的数据。
关键词:多元线性回归模型,多元线性回归模型的矩阵表示,及的最小二乘估计,统计推断。
线性回归模型
1、线性回归模型及其矩阵表示
设Y是一个可观测的随机变量,它受到p-1个非随机因素和随机因素的影响。若Y与有如下线性关系:
称此模型为线性回归模型,其中是未知参数(回归系数);是应变量或响应变量;称自变量或回归变量;称为随机误差项并假定是不可观测的随机变量,而Y与是可观测的变量。要建立多元线性回归模型,首先要估计未知参数进行n(np)次独立观测,得到n组数据(样本)
其中相互独立且均服从分布。
令
其中Y称为观测向量,X称为设计矩阵。并假定X为列满秩的,即,是对估计的未知参数商量,是不可观测的随机误差商量。是多元线性回归模型的矩阵形式。
2、参数估计
2.1的最小二乘估计
如果Y与满足线性回归模型侧误差应是比较小的,因此,选择使误差项的平方和
达到最小,其中 ,为此,将分别对求偏导并令其等于零,得
K=0,1,…,P-1
即 K=0,1,…,P-1
矩阵形式是称此方程为正规方程。
因为故存在,解正规方程即得的最小二乘估计为
2.2误差方差的估计
将自变量的名组观测值代入回归方程,可得因变量的各估计值(称为拟合值)为
称
为残差向量,其中为 n阶对称幂等矩阵,I为n阶单位矩阵,称数
为残差平方和(SSE)
注意到且,故
因此可得
其中表示矩阵的迹,从而
为的无偏估计。
3、有关的统计推断
3.1回归关系的统计推断
给定因变量Y与自变量的n组观测值,利用前述方法可得到未知参数和的估计,从而可给出Y与之间的线性回归方程,但所求得的回归方程是否有意义,也就是说Y与之间是否存在显著的线性关系,还需要对回归方程进行检验。
3.1.1 建立方差分析表
我们知道观测值之所以有差异是由下述两个原因引起的,一是当 Y 与之间确定有线性关系时,由于取值的不同,而引起值的变化;另一方面是除去Y 与的线性关系以外的因素,如对的非线性影响及随机因素的影响等,记
则数据的总的离差平方和
反应了数据波动性的大小
残差平方和
反应了数据除去Y与之间的线性关系以外的因素引起的数据的波动。
如果
回归平方和
反应了线性拟合值与它们的平均值的总偏差即由变量的变化所引起的的波动。
若
SSE,SST和 SSR有如下形式的矩阵表示
J表示一个元素全为1的 n 阶方阵。
自由度:自由度是指平方和中独立变化项的数目。由于有一个关系式 即彼此不是独立变化的,故SST的自由度是n-1,SSE的自由度为n-p,SSR的自由度为p-1,它们的自由度关系是:
n-1=(n-p)+(p-1)
方差分析表
方差来源 平方和(SS) 自由度(F) 均方(MS) 回归 p-1 误差 n-p 总和 n-1 利用方差分析表,可对回归方程的显著性做检验。
3.1.2 线性回归关系的显著性检验
为检验Y与之间是否存在显著的线性回归关系,即检验。
假设
给定显著性水平查分布表得临值,计算 F的观测值。
若:
3.2 回归参数的统计推断
回归关系中不一定每个自变量X对Y的影响都显著的。因此,我们对自变量对的显著性关系进行检验。
检验假
的最小二乘估计为
则
而
所以
由于为的无偏估计,从而自然地以
作为的估计。
所以的估计
其中为的全对角线上的第k个元素的平方根,
t(n-p)为自由度为n-p的分布
若: 为真
不真 有偏大的趋势
4、实例
摸公司在各地区销售一种特殊的化妆品,该公司观测了15个城市在某个月内对该化妆品的销售量Y及各地区适合使用该化妆品的人数和人均收入的数据如下。
化妆品销售的调查数据
地区
i 销量
人数(千人)
人均收入(元)
1 162 274 2450 2 120 180 3254 3 223 375 3802 4 131 205 2838 5 67 86 2347 6 169 265 3782 7 81 98 3008 8 192 330 2450 9 116 195 2137 10 55 53 2560 11 252 430 4020 12 232 372 4427 13 144 226 2660 14 103 157 2088 15 212 370 2605 假设误差服从分布,试建立与之间的线性回归方程并研究
您可能关注的文档
- 探析数控切削中刀具选择及应用精选.doc
- 接触网高速电气化铁路接触网悬挂模式设计精选.doc
- 控制技术课程设计说明书-电压可调输出电源控制系统设计精选.doc
- 捷信达仓库系统用户操作手册精选.doc
- 接线盒塑料模具毕业设计精选.doc
- 控制测量课程设计报告精选.doc
- 控制测量课程设计精选.doc
- 控制系统仿真基于模糊控制器的纸浆浓度控制系统精选.doc
- 控制系统仿真单神经元PID控制系统仿真精选.doc
- 控制系统一阶倒立摆控制器设计精选.doc
- 基于人工智能教育平台的移动应用开发,探讨跨平台兼容性影响因素及优化策略教学研究课题报告.docx
- 高中生物实验:城市热岛效应对城市生态系统服务功能的影响机制教学研究课题报告.docx
- 信息技术行业信息安全法律法规研究及政策建议教学研究课题报告.docx
- 人工智能视角下区域教育评价改革:利益相关者互动与政策支持研究教学研究课题报告.docx
- 6 《垃圾填埋场渗滤液处理与土地资源化利用研究》教学研究课题报告.docx
- 小学音乐与美术教师跨学科协作模式构建:人工智能技术助力教学创新教学研究课题报告.docx
- 《航空航天3D打印技术对航空器装配工艺的创新与效率提升》教学研究课题报告.docx
- 教育扶贫精准化策略研究:人工智能技术在区域教育中的应用与创新教学研究课题报告.docx
- 《区块链技术在电子政务电子档案管理中的数据完整性保障与优化》教学研究课题报告.docx
- 《中医护理情志疗法对癌症患者心理状态和生活质量提升的长期追踪研究》教学研究课题报告.docx
文档评论(0)