- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
将化石分类—同一总体具有相似性,不同总体则有异质性 考古学家发现了6块始祖鸟的化石,而且大小相差很大,有人认为这些标本可能来自不同的种类,而不是同一种类的不同个体?同时保存有股骨和肱骨大小的化石有5块,测量的数据如下: 股骨 38 56 59 64 74 肱骨 41 63 70 72 84 因为不清楚变量之间的关系,可将任意变量作为横轴,画散点图。 股骨为X轴的散点图 结论:来自同一种类,只是个体之间有差异。 相关系数 散点图是直观地描述两个变量之间相关的方向、形式和强度的工具,但不精确。 相关系数则是一个精确的测量线性相关的统计指标。常用r 表示。计算公式如下: 股骨 肱骨 x y x-均值 (x-均值)的平方 y-均值 (y-均值)的平方 x的标准计分 y 的标准计分 标准分的乘积 38 41 -20.2 408.04 -25 625 -1.530 -1.573 2.408 56 63 -2.2 4.84 -3 9 -0.167 -0.189 0.031 59 70 0.8 0.64 4 16 0.061 0.252 0.015 64 72 5.8 33.64 6 36 0.439 0.378 0.166 74 84 15.8 249.64 18 324 1.197 1.133 1.356 合计 291 330 0 696.8 0 1010 3.976 均值 58.2 66 方差 174.2 252.5 标准差 13.20 15.89 相关系数 0.9941 了解相关系数的意义 r的正负号,表示相关的方向; 相关系数的取值范围:[-1,+1] 相关系数不受计量单位的影响; 描述两个变量的相关关系,不受变量地位改变的影响; 相关关系只描述数值型变量的相关; 相关关系描述的是直线或线性相关; 相关系数受异常值的影响。 下面关于相关系数的叙述是否正确? 1. 就业者的性别和收入之间有很高的相关系数; 2. 我们发现在学生对教授的评价和其他同行对教授的评价之间,存在很高的相关系数,r=1.09 ; 年龄和收入之间的相关系数为r=0.533岁。 小结 散点图---如何展示 检视散点图---发现什么信息:相关方向、形式、强度 相关系数的计算 描述相关关系:回归、预测与因果关系 预测股市的方法—是否有用? 人工神经网络 基因演算法 近邻模型 其他模型归类技巧 混沌 碎形 小波理论的时间序列转换 回归直线 如果一个散点图中两个变量之间的关系呈现线性相关,我们会试图画一条直线来描述其整体形态。 回归直线就是对两个变量之间的关系进行概述,但其条件是:其中一个变量可以用来解释或预测量另一个变量的变化。 回归描述的是一个解释变量与一个反应变量之间的相关关系。 回归直线 回归直线(Regression line)是一条直线,描述当解释变量x的值改变时,反应变量y是怎样跟着变的。 常用回归直线预测:对于某一个给定的x值,y值会是什么。 例如:化石骨头中有一块股骨已知,但肱骨未知,这时,我们可以根据其他5块股骨和肱骨数据之间的相关关系建立模型后,将股骨长度带入模型得到肱骨的长度。 模型估计方法—OLS-Ordinary Least Square Mothod 可以描述散点图整体形态的执行直线可以有很多条,哪一条是好的? 我们所要的直线是:在垂直方向和点尽量接近的直线。这就需要一个方法,来根据数据寻找垂直方向距离点最近的直线方程。有很多方法可以使垂直距离”越小越好”,其中最常用的方法是最小二乘法(Least-Square Method) 最小二乘法回归直线 y对x的最小二乘法回归直线(Least-square regression line),是使得所有数据点距离直线的垂直距离平方和为最小的直线。---见下图 直线方程: y=a+bx 含义:y:被解释变量,x 解释变量,a代表截距(intercept),表示当x为0时y的取值; b代表直线的斜率(slope),表示x变化1个单位时y的改变量。进行预测时,将x的值代入方程,计算出的y值。 利用化石分类模型预测 肱骨与股骨的回归方程: 肱骨=-3.66+1.197*股骨 解释参数的含义 1.197表示股骨每增加1cm,肱骨的增加量; 截距-3.66 ,没有统计意义; 预测。当股骨为50时,肱骨长度为: 肱骨=-3.66+1.197*50=56.2cm 了解预测的意义 如何预测和画图,计算机可以完成,但如何进行变量选择,谁是因,谁是果?如何选择合适的模型?是多变量还是单变量模型等都需要人的判断与选择。 无论采用什么模型,但基本的观点具有共性。 预测的意义 预测根据的是对数据匹配的某个模型(model); 模型匹配得越好,误差越
文档评论(0)