- 1、本文档共73页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第七章 相关与回归分析 第一节相关分析 变量间的关系(函数关系) 是一一对应的确定关系 设有两个变量 x 和 y ,变量 y 随变量 x 一起变化,并完全依赖于 x ,当变量 x 取某个数值时, y 依确定的关系取相应的值,则称 y 是 x 的函数,记为 y = f (x),其中 x 称为自变量,y 称为因变量 各观测点落在一条线上 变量间的关系(函数关系) 变量间的关系(相关关系) 变量间关系不能用函数关系精确表达 一个变量的取值不能由另一个变量唯一确定 当变量 x 取某个值时,变量 y 的取值可能有几个 各观测点分布在一条线的周围 变量间的关系(相关关系) 一、相关的概念 相关关系是指自然界和社会中许多现象之间存在的数量上的相互联系、相互依存、相互制约的关系。 二、相关关系的类型 按涉及的变量分为:简单相关和复相关。 按表现形态分为:直线相关和曲线相关。 直线相关按变化方向分为:正相关和负相关。 按相关程度分为:完全相关、不完全相关、不相关。 相关关系的图示 三、相关系数的测定 相关系数计算公式 简单计算公式 相关系数取值及其意义 r 的取值范围是 [-1,1] |r|=1,为完全相关 r =1,为完全正相关 r =-1,为完全负相关 r = 0,不存在线性相关关系 -1?r0,为负相关 0r?1,为正相关 |r|越趋于1表示关系越密切;|r|越趋于0表示关系越不密切 四、相关的密切程度 R= 0.3 — 0.5低度相关 R= 0.5 — 0.8显著相关 R= 0.8以上高度相关 五、相关系数的计算 1.手算实例。 X:-2,-1,0,1,2; Y:2,3,3,5,7 2.相关系数大小与样本数据多少的关系: 数据越多相关系数越准确。 第二节一元线性回归模型 一、什么是回归分析 回归分析是从一组变量(X,Y)的样本数据出发,根据变量的相关类型,确定变量之间相关关系的数学表达式的统计分析方法。 为了研究父亲与成年儿子身高之间的关系,卡尔.皮尔逊测量了1078对父子的身高。把1078对数字表示在坐标上,如图。用水平轴X上的数代表父亲身高,垂直轴Y上的数代表儿子的身高,1078个点所形成的图形是一个散点图。它的形状象一块橄榄状的云,中间的点密集,边沿的点稀少,其主要部分是一个椭圆。 家庭对某种商品的需求量与该商品价格之间的调查数据: 变量Y与X之间的关系可表示成 其中, 是一个误差项,它包含 1.模型中省略的变量 2.一些随机因素 3.测量(观测)误差 4.数学模型设定形式的误差 将n组样本(x1,y1),…,(xn,yn)代入(1)得: (1)称为总体回归模型,(2)称为样本回归模型。(1)式两边求数学期望: 由于 是随机因素,通常就用 作为 的估计,故得: 表示 的估计,则(3)称为y关于x的一元线性回归方程(回归直线)。 对(2)式两边求数学期望得: 或者 回归分析的主要任务就是通过n组样本观测值 对 进行估计。一般用 分别表示 的估计值。则称 为y关于x的一元线性经验回归方程。 记: 或者公式: 第四节线性关系的显著性检验 离差平方和的分解(图示) 二、回归方程的显著性检验( F-检验)* (线性关系的检验 ) 检验自变量和因变量之间的线性关系是否显著 具体方法是将回归平方和(SSE)同残差平方和(SSR)加以比较,应用F检验来分析二者之间的差别是否显著 如果是显著的,两个变量之间存在线性关系 如果不显著,两个变量之间不存在线性关系 F-检验的步骤 提出假设 估计标准误差 Sy (standard error of estimate) 估计标准误差是对回归模型随机误差项?的标准差?的估计,即观察值与回归估计值离差平方和的均方根,是在排除了x对y的线性影响后对因变量y随机波动大小的一个估计量。 反映观察值在回归直线周围的分散程度和回归方程对因变量代表性的大小,其数值越大说明代表性越小。也反映用估计的回归方程预测y时预测误差的大小,其数值越大说明预测误差越大。 可从另一个角度说明回归直线的拟合程度。 计算公式为 估计标准误差与相关系数的关系 可以看出估计标准误差Sy与
文档评论(0)