- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
* 第5节 数理统计 一.数理统计及其意义 许多问题需要数据加以说明、分析数据也可解释实际问题,作出决策。 ◆ 数据的收集和分析 ◆ 数理统计 (mathematical statistics) 物价、工资、存款利率、税收、保险、股票、就业率、录取率 社会调查,数据分析,分析判断 研究如何收集和使用带有随机性影响数据的学科. ● 数据本身虽然没有随机性,但由于数据数量太 多,无法全部得到,只能抽样统计 数理统计研究的数据带有随机性 数据的随机性主要有两个来源: ● 实验有随机误差 数理统计的两个步骤 ▲ 通过实验或观察收集必要的数据(抽样) 如何随机性地收集这些数据和抽多少数据? 标准 抽取 个数据 时,要使它们反映的信息越多越好;它们分布应均匀,有“代表性”. 收集数据有两种方法 抽样理论(sampling theory) 试验设计(experiment design) ▲ 对收集的数据进行分析,以作决策 有效地使用数据 分析数据的方法: 统计推断(statistical inference) 二.假设检验问题 e.g.1 药效问题 对某一疾病研制了一种用于预防的新药,现检验疗效.设某地区猪患这种病的概率是 0. 25(这种病非传染病,患病与其他猪无关).现选 12 头猪作实验,结果发现,这些猪服药后均未患病,试讨论此药的疗效. 命题:新药无效 ? Remark ?这里说“新药有效”,犯错误的概率是3. 2%. 确切地说,有97. 8%的概率可认为新药有效. e.g.2 产品检验问题 给某产品包装,每 180 个产品打成一包,要求合格品为每包产品中次品数不超过 8 个.现质检员任取一包,从中抽取 4 个进行检测,发现其中有 2 个次品,问该产品是否合格? 命题: 这包产品合格 上述两例有一个共同点:利用观测结果(所取样本)对实际问题中的有关命题 “作正确与否” 的判断. 我们把这种需要作出判断的命题称为 “统计假设” (statistical hypothesis),简称 “假设” .判断它正确与否的方法称为 “检验”(test), 这类问题称为“假设检验”(hypothesis testing). Remark 这里肯定或否定命题都不能保证不犯错误,只是我们以很高的概率来肯定或否定它. e.g.3 骰子的均匀性 骰子每面向上的概率均为 1/6 时,认为是均匀的.检验时,比如“ 1 点向上”的概率是否 1/6 ? 问题:一骰子掷了 次,其中 1 点出现了 次,问:命题“ 1 点出现的概率等于1/6 ”这一假设是否成立? 分析: 1 点出现的频率 假设成立? 频率与概率的偏差 (不足十万分之四) 三.估计问题 1. 概率分布的估计 为估计某事件 发生的概率 ,作 次实验或观测. 看 发生了几次. 发生的频率 可用来作为事件 的概率 的估计值。 越大,估计越好. e.g. 商店欲估计周日上午 8:00—12:00 间每分钟到达的顾客人数 的分布,即估计 观测了 20 个周日,共 分钟,记录下了每分钟到达的顾客数(4800个数据). 设到达 个顾客的分钟数为 , 记 分布律为 0 1 2 …… …… 即用到达 个顾客的频率 来估计概率 商店经理可根据这一估计来合理安排售货员. 2. 其它参数的估计 任何模型(包括确定性模型)总有待定参数,要通过对实际问题的观测或试验来确定。由于观测误差,因此观测值具有随机性.我们要找出估计的方法. e.g. 估计某地区农户的平均收入(收入均值,记为 ),随机地抽取 户,他们的收入为 , 可用其平均数 来估计整个地区农户的平均收入 . 若另一人用同样方法随机抽取 个农户,他们的收入为 . 一般与 不同. 因此只能说“估计”均值 . e.g.4 汽车产量的估计 利用观测城市中汽车牌照号码来估计全城汽车数. 假设:汽车牌照号码按自然数顺序从 1 开始排列. 把每个汽车号码看成一个小数,即把
文档评论(0)