回归分析之一.ppt

下载文档 降价啦

6
0
约 50页
2017-09-23 发布于河南
举报
版权申诉
保障服务

回归分析之一.ppt

1、本文档共50页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 模型进一步复杂化增加第二个限制性的参数两种可能遇到的情况两组实验设计简单回归分析两组设计对应于独立样本的t检验我们用X表示一个观测到的数值里属于哪个组别： Xi = -1 if in group A, Xi = +1 if in group B 这种情况我们将在以后的课程中进行讨论简单回归分析（其中X是连续变量）例如垒球中的入场人数于平均击球次数模型所估计参数的代数解释 b0是当X为0是Y的预测值； b1是当X改变一个单位时，我们所预测到的Y的变化。所估计参数的几何解释截距与斜率回归线 b0和b1的计算原理：使误差最小误差误差表误差的变异（MSE）预测的标准误模型比较两参数模型单参数模型两模型比较的图示关于β1的统计推断等价的假设: H0: 保留模型 C HA: 接受模型A H0: η2=0 HA: η2>0 H0: β1 =0 HA: β1 ≠ 0 SSE与PRE SSR = SSE(C) – SSE(A) SSR = 1023.6 - 897.2 = 126.4 * * * * * * * * * * * * * 回归分析与实验设计之一数据分析概述 2005年各省大型连锁专业店数目数据来自国家统计局网站（）序号省份数量序号省份数量 1 北京 2072 17 湖北 1825 2 天津 537 18 湖南 2533 3 河北 857 19 广东 5589 4 山西 398 20 广西 1660 5 内蒙古 1270 21 海南 282 6 辽宁 2240 22 重庆 4307 7 吉林 332 23 四川 1630 8 黑龙江 599 24 贵州 1009 9 上海 3392 25 云南 1585 10 江苏 3871 26 西藏 2 11 浙江 3770 27 陕西 180 12 安徽 3943 28 甘肃 1245 13 福建 1557 29 青海 38 14 江西 1831 30 宁夏 335 15 山东 4115 31 新疆 539 16 河南 698 数据分析概述数据分析的一般思路是： DATA = MODEL + ERROR 因此，数据分析的基本目标就是尽可能减少误差，增加模型的代表性。数据分析概述简单模型与扩展模型 Model C (compact model) vs. Model A (Augmented model) 误差减少率（PRE）模型与误差一个最简单的模型: 从误差的角度思考, 我们可以说如果没有误差，Y所有的取值将等于模型（β）误差中间包括除了模型之外的所有可能影响到Y的取值的因素。误差可能的误差的代表性度量问题：如何选择? 对ERROR的定义 b0的值对error的计数众数 error绝对值的和中数 error平方的和平均数 Error加权平方的和加权平均数一个参数估计值的性质无偏性（Unbiasedness） 2.有效性（Efficiency） 3. 一致性（Consistency）平均值抽样分布的标准误：中位数抽样分布的标准误：比较：均值和中数作为模型参数两者都是模型参数的无偏估计都是一致的估计均值的标准误小于中数的标准误，因此相对于中数，均值是一个更为有效的估计关于误差的假设误差正态分布 2. 误差独立 3. 误差变异齐性 4. 误差无偏例1：某年级学生历年来平均数学成绩为65，某教师采用新的教学方法，结果他班上15名学生的平均成绩为78。校长想知道这个班所代表的群体的平均成绩是否显著的不同于65。具体成绩如下： Y=72, 52, 93, 86, 96, 46, 55, 74, 129, 61, 57, 115, 79, 89, 68 单组t检验的方法 H0: μ = 65 HA: μ≠ 65 从模型比较的角度思考最简单的模型，没有参数： Yi = B0 + εi 其中B0是一个未经估计的任意常数新的较为简单的模型, 有一个参数 Yi = β0 + εi 其中β0 是一个可以从数据中估计产生的参数. b0 (样本均值) 是我们对 β0的估计值, 因此： Yi = b0 +ei 假设检验假设 (双侧) H0: β0 = B0 其中 β0 = μ 且 B0 = 65 HA: β0 ≠ B0 or H0: μ = 65 HA: μ≠ 65 模型 MODEL C: (简单模型)