- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
相关系数 可见 |r|越接近于1,直线回归越好。 如果|r|接近于1,F值就会比较大。但是如果没有线性相关关系,F值较大的可能性很小。所以据此判断有线性相关关系。 事实上,如果没有线性相关关系,那么 例:教材73页例一的数据。用 Excel计算: 1、输入数据 2、作散点图:插入—图表—散点图 3、作回归方程:激活散点图—点一个散点—右键—添加趋势线—线性—选项卡—显示公式,R平方值 回归 也可以用计算器:MODE+2 进入回归状态 1、输入数据:SHIFT+KAC(即开关键)开始输入数据: 95+(xD,yD)(四排一键)+6.2+DATA键(最后一键) 这样就完成一对数的输入。重复地输入所有数据; 2、SHIFT+A (即7键) 给出 a,SHIFT+B (即8键)给出b; 3、SHIFT+r(即9键)给出相关系数; 4、输入一个x值+y^键(四排二键)给出对应的y的预测值; 5、输入一个y值+SHIFT+x^键(四排二键)给出对应的x的控制值。 第五节 独立性检验 美国在杀人犯的死刑判决中存在种族差异?一位叫Radelet的研究人员对此进行了研究。 怎样研究? 总体:美国杀人犯 问题:A表示杀人犯是白人, B表示被判处死刑。 A,B这两个随机事件是否独立? A,B如果独立,则 这些式子用一句话说就是: 杀人犯是白人还是黑人和判不判死刑没有关系 我们怎样来判断这个言论的对错呢? 用统计的方法,估计上面涉及到的每一个概率, 看看估计的结果和上面的等式之间会不会发生冲突。 所以,首先要抽样。 在杀人犯中任取326人,其中 白人160名,黑人166名。 结果发现: 160名白人中有19人被判死刑,141人未判死刑; 166名黑人中有17人被判死刑,149人未判死刑。 为了便于说明,我们把这些数据总结在如下的表格中: 我们先列出上面提到的所有概率的估计值: 如果A,B相互独立,那么下面各数都不应该太大: 英国统计学家Pearson证明,如果如果A,B相互独 立,那么当n趋向于无穷大时, 将是一个 的随机变量。 作为统计量的 服从自由度为1的 分布 如果A,B相互独立,则当n比较大时,有 , , 都是小概率事件 所以,如果我们把表里的数据代到公式里求出的 大于其中的某个数,我们就有理由做出 A,B不相互独立 的结论。 在死刑问题里 小概率事件没有发生。所以我们没有理由否定 A,B相互独立 的结论,认为数据不能充分说明在死刑判决中存在种族差异。 简化计算公式 * 第二节 总体分布的估计 统计的任务: 在统计里我们感兴趣的是:如果从总体中任取一个个体,这个个体的某个或几个数量指标会有什么特征?我们不知道其指标会是多少。统计的任务就是希望搞清楚,任取一个个体,其指标会遵循什么规律。 当然不会是一个确定性的规律,而是一个“统计规律”,就是一个具有概率意义的规律。例如某地某段时间里高温出现概率;某校高一年级男生的身高在某个范围里的概率。 从总体中任取一个个体,其指标不知道会是多少,就把它作为一个随机变量对待。 对总体的研究,就是要达到搞清楚这个随机变量的分布的目的。这就是统计的基本目的。 在概率论里,我们研究各种分布。在统计里,我们要利用样本数据确定表示总体指标的那个随机变量到底应该是什么分布。如果分布完全是已知的,那统计就没有任何意义了。 参数问题:对总体指标的数字特征,比如数学期望,方差,中为数等的估算、刻画。 非参数问题 多个随机变量之间的关系问题 所以,要知道我们会遇到的问题: 刻划总体分布 刻划总体数字特征 刻划各种关系 在所有的问题中,归根结底是估计概率的问题,而估计概率最基本的方法,就是利用频率。要计算频率,就要抽样——做实验获取数据。 由于我们是从样本出发做出的结论,结论势必会有出错的可能。 数理统计的结论不同于其他的结论,其精华就在于: 在给出结论的同时,还会告诉你, 这个结论出错的概率有多大。 总体分布的估计方法 频率分布表 全距 组距 频数 频率 频率/组距 频率分布直方图与折线图 频率直方图 第三节 总体特征数的估计 总体分布的特征数有各种各样,我们在概率论里叫它们作数字特征。例如数学期望,方差,中位
文档评论(0)