独立性检验探析.doc

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
 变量间 知 识 梳 理 变量间的相关关系 (1)常见的两变量之间的关系有两类:一类是函数关系另一类是相关关系;与函数关系不同相关关系是一种非确定性关系. (2)从散点图上看点散布在从左下角到右上角的区域内两个变量的这种相关关系称为正相关点散布在左上角到右下角的区域内两个变量的相关关系为负相关. 回归分析 对具有相关关系的两个变量进行统计分析的方法叫回归分析.回归直线方程;(ⅲ)用回归直线方程作预报. (1)回归直线:如果散点图中点的分布从整体上看大致在一条直线附近就称这两个变量之间具有线性相关关系这条直线叫做回归直线. (2)回归直线方程的求法——最小二乘法. 设具有线性相关关系的两个变量x的一组观察值为(x)(i=1),则回归直线方程=+的系数为: 其中==(x,y)称为样本点的中心. (3)相关系数 计算相关系数r有以下性质:|r|≤1并且|r|越接近1线性相关程度越强;|r|越接近0线性相关程度越弱; 表明有95的把握认为变量x与Y直线之间具有线性相关关系回归直线方程有意义;否 3.独立性检验 (1)2×2列联表 B 合计 A n n12 n1+ n22 n2+ 合计 n+1 +2 其中n+=n+n+=n+n+1=n+n+2=n+n=n+n+n+n (2)χ2统计量 = (3)两个临界值:3.841与6.635 当χ时有95的把握说事件A与B有关; 当χ时有99的把握说事件A与B有关; 当χ1时认为事件A与B是无关的. 考点一 相关关系的判断 【例1】 (1)在一组样本数据(x),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中若所有样本点(x)(i=1)都在直线y=+1上则这组样本数据的样本相关系数为(  ) -1 . D.1 (2)对变量x有观测数据(x)(i=1),得散点图(1);对变量u有观测数据(u)(i=1),得散点图(2).由这两个散点图可以判断(  ) 变量x与y正相关与v正相关 变量x与y正相关与v负相关 变量x与y负相关与v正相关 变量x与y负相关与v负相关 【训练1】 变量X与Y相对应的一组数据为(10),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10),(11.3,4),(11.8,3),(12.5,2),(13,1).r表示变量Y与X之间的线性相关系数V与U之间的线性相关系数则(  ) <r<0 .<r<r C.r2<0<r=r 考点回归方程的求法及回归分析 【例2】 从某居民区随机抽取10个家庭获得第i个家庭的月收入x(单位:千元)与月储蓄y(单位:千元)的数据资料算得=80yi=20xiyi=184x=720. (1)求家庭的月储蓄y对月收入x的线性回归方程=+; (2)判断变量x与y之间是正相关还是负相关; (3)若该居民区某7千元预测该家庭的月储蓄. 附:线性回归方程=+中= 【训练2】 (2014·云南检测)春节期间某销售公司每天销售某种取暖商品的销售额y(单位:万元)与当天的平均气温x(单位:)有关.现收集了春节期间这个销售公司4天的x与y的数据列于下表: 平均气温() -2 -3 -5 -6 销售额(万元) 20 23 27 30 根据以上数据用线性回归的方法求得y与x之间的线性回归方程x+的系数=-则=________ 考点三 独立性检验 【例3】 (2014·安徽卷)某高校共有学生15 000人其中男生10 500人女生人.为调查该校学生每周平均体育运动时间的情况采用分层抽样的方法收集300位学生每周平均体育运动时间的样本数据(单位:小时). (1)应收集多少位女生的样本数据? (2)根据这300个样本数据得到学生每周平均体育运动时间的频率分布直方图(如图所示)其中样本数据的分组区间为:[0],(2,4],(4,6],(6,8],(8,10],(10,12].估计该校学生每周平均体育运动时间超过4小时的概率; (3)在样本数据中有60位女生的每周平均体育运动时间超过4小时请完成每周平均体育运动时间与性别列联表并判断是否有95的把握认为“该校学生的每周平均体育运动时间与性别有关”. 附:χ= (χ2≥k0) 0.10 0.05 0.010 0.005 k0 2.706 3.841 6.635 7.879 【训练3】 某学生对其亲属30人的饮食习惯进行了一次调查并用下图所示的茎叶图表示30人的饮食指数(说明:图中饮食指数低于70的人饮食以蔬菜为主;饮食指数高于70的人饮食以肉类为主). (1)根据以2×2列联表: 主食蔬菜 主食肉类 合计 50岁以下 岁以上 合计 (2)能

文档评论(0)

***** + 关注
实名认证
内容提供者

我是自由职业者,从事文档的创作工作。

1亿VIP精品文档

相关文档