- 1、本文档共14页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
总结线性回归分析的基本步骤
线性回归分析的基本步骤
步骤一、建立模型
知识点:
1、总体回归模型、总体回归方程、样本回归模型、样本回归方程
①总体回归模型:研究总体之中自变量和因变量之间某种非确定依赖关系的计量模型。
特点:由于随机误差项U的存在,使得Y和X不在一条直线/平面上。
例1:某镇共有60个家庭,经普查,60个家庭的每周收入(X)与每周消费(Y)数据如下:
每周收入(X) 每周消费支出(Y) 80 55 60 65 70 75 100 65 70 74 80 85 88 120 79 84 90 94 98 140 80 93 95 103 108 113 115 160 102 107 110 116 118 125 180 110 115 120 130 135 140 200 120 136 140 144 145 220 135 137 140 152 157 160 162 240 137 145 155 165 175 189 260 150 152 175 178 180 185 191 作出其散点图如下:
②总体回归方程(线):由于假定,因此因变量的均值与自变量总处于一条直线上,这条直线就称为总体回归线(方程)。
总体回归方程的求法:以例1的数据为例
1)对第一个Xi,求出E(Y|Xi)。
每周收入(X) 每周消费支出(Y) E(Y|Xi) 80 55 60 65 70 75 65 100 65 70 74 80 85 88 77 120 79 84 90 94 98 89 140 80 93 95 103 108 113 115 101 160 102 107 110 116 118 125 113 180 110 115 120 130 135 140 125 200 120 136 140 144 145 137 220 135 137 140 152 157 160 162 149 240 137 145 155 165 175 189 161 260 150 152 175 178 180 185 191 173 由于,因此任意带入两个Xi和其对应的E(Y|Xi)值,即可求出,并进而得到总体回归方程。
如将代入可得:
以上求出反映了E(Y|Xi)和Xi之间的真实关系,即所求的总体回归方程为:,其图形为:
③样本回归模型:总体通常难以得到,因此只能通过抽样得到样本数据。如在例1中,通过抽样考察,我们得到了20个家庭的样本数据:
每周收入(X) 每周消费支出(Y) 80 55 100 65 70 120 79 84 140 80 93 160 102 107 110 180 110 200 120 136 220 135 137 240 137 145 260 150 152 175 那么描述样本数据中因变量Y和自变量X之间非确定依赖关系的模型就称为样本回归模型。
④样本回归方程(线):通过样本数据估计出,得到样本观测值的拟合值与解释变量之间的关系方程称为样本回归方程。如下图所示:
⑤四者之间的关系:
ⅰ:总体回归模型建立在总体数据之上,它描述的是因变量Y和自变量X之间的真实的非确定型依赖关系;样本回归模型建立在抽样数据基础之上,它描述的是因变量Y和自变量X之间的近似于真实的非确定型依赖关系。这种近似表现在两个方面:一是结构参数是其真实值的一种近似估计;二是残差是随机误差项U的一个近似估计;
ⅱ:总体回归方程是根据总体数据得到的,它描述的是因变量的条件均值E(Y|X)与自变量X之间的线性关系;样本回归方程是根据抽样数据得到的,它描述的是因变量Y样本预测值的拟合值与自变量X之间的线性关系。
ⅲ:回归分析的目的是试图通过样本数据得到真实结构参数的估计值,并要求估计结果足够接近真实值。由于抽样数据有多种可能,每一次抽样所得到的估计值都不会相同,即的估计量是一个随机变量。因此必须选择合适的参数估计方法,使其具有良好的统计性质。
2、随机误差项U存在的原因:
①非重要解释变量的省略
②人的随机行为
③数学模型形式欠妥
④归并误差(如一国GDP的计算)
⑤测量误差等
3、多元回归模型的基本假定
①随机误差项的期望值为零
②随机误差项具有同方差性
③随机误差项彼此之间不相关
④解释就变量X1,X2,···,Xk为确定型变量,与随机误差项彼此不相关。
⑤解释就变量X1,X2,···,Xk之间不存在精确的(完全的)线性关系,即解释变量的样本观测值矩阵X为满秩矩阵:rank(X)=k+1n
⑥随机误差项服从正态分布,即:ui~N(0,s2),i=1,2,···
您可能关注的文档
- 总结的2014计算机二a级ccess选择题.doc
- 总结高中数学选修模块教中学的重点知识内容.doc
- 总结:线性回归分析的基步本骤.doc
- 总论作为宪法权利的社会保障权基于文本与判例分析.doc
- 最专业易用的图片打印软件.doc
- 总述皮革化学品及其分类.doc
- 总部办公室组织与流程问卷.doc
- 最优捕鱼策略实验报告.doc
- 最伤害电脑硬盘的六大软件.doc
- 最低工资标准下的福建鞋业现场调查与案例跟踪.doc
- 天津市涂料及胶粘剂产品质量监督抽查实施细则.pdf
- 产品质量监督抽查实施细则-燃气用具连接用软管.doc
- 2020年开关插座产品质量广西监督抽查实施细则.doc
- 人造石产品质量省监督抽查实施细则.pdf
- XZ30-2021海南省易爆品及石化产品产品质量监督抽查实施细则.doc
- 重庆市聚氯乙烯绝缘电缆电线(非阻燃类)产品质量监督抽查实施细则(2020年二季度).pdf
- TGXAS-人类辅助生殖技术实验室 卵子胚胎冷冻解冻技术操作规程.docx
- 2025年北京市建筑用钢材产品质量监督抽查实施细则.doc
- 北京市照明产品质量监督抽查实施细则.doc
- 2024年北京市工业防护涂料产品质量监督抽查实施细则.pdf
最近下载
- 水泥厂电气培训课件.pptx
- 体例格式9:工学一体化课程《windows服务器基础配置与局域网组建》任务1学习任务工作页.docx VIP
- 金税四期税务风险预警指标汇总.pdf
- 豆腐柴人工栽培技术.pdf VIP
- 天津市小升初小卷真题小外(天津市外国语大学附属外国语学校)(5套含答 .pdf VIP
- 控制计划(机加).docx VIP
- 土地资源管理学(第二版)张正峰,第一至第十二章知识点.docx VIP
- 专题三 透镜及其应用 2025年中考物理基础知识考点专题练习(含答案).docx VIP
- DL/T 502-2006 火力发电厂水汽分析方法(第1-32部分).pdf VIP
- 施工现场总平面布置培训.pptx VIP
文档评论(0)