网站大量收购独家精品文档,联系QQ:2885784924

概率与数理统计书稿第六章 数理统计基本概念.docVIP

概率与数理统计书稿第六章 数理统计基本概念.doc

  1. 1、本文档共19页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
概率与数理统计书稿第六章 数理统计基本概念

PAGE 130PAGE 131第六章 数理统计的基本概念§6.1 引 言6.1.1 什么是数理统计学在数理统计学教科书和专著中,有关数理统计学的性质、任务、应用等方面的论述,目前在统计学界并无原则性的分歧.但却很难对“数理统计学”下一个正式的、完全无懈可击的定义.因此,我们宁可致力于从某些方面把数理统计学的实质说清楚,而不着重于一个形式的定义.当用观察和实验的方法去研究一个问题时,首先要通过试验“用有效的方式收集受随机性因素影响的数据”;其次要对所收集的数据进行分析,以对所研究的问题作出某种形式的结论.在这两个步骤中,都会碰到许多数学问题.为解决这些问题而建立的理论和方法,构成了数理统计学的内容.故一般地可以说,数理统计学是数学的一个分支,它的任务是研究怎样用有效的方法去收集和使用带随机性影响的数据.1.数据必须带有随机性的影响,才能成为数理统计学的研究对象.例如,考虑一个国家的全面人口普查,假定对国内每一个人的状况都进行了准确无误的调查,则可利用普查所得数据,把所感兴趣的指标(如男性人口占总人口的比例等)准确计算出来.这里的观测数据不带有随机性,因而不需要数理统计方法.又如要比较甲、乙两个小麦品种的产量高低,若我们作一个不大现实的假定,即其他条件可以控制得如此严格(且这种条件也是日后大面积推广时所使用的),以致产量完全取决于品种,则我们只须在两块地上把甲、乙各种植一次,就可准确无误地判断其优劣,这时数理统计方法也没有用武之地.总之,是否假定数据有随机性,是区别数理统计方法和其他数据处理方法的根本点.数据的随机性来源有如下两个方面:一是问题中所涉及的研究对象为数很大,我们不可能对之全部加以研究,而只能用“一定的方式”来挑选其一部分去考察.例如,一批产品有10000件,其中含有次品m件,m未知,因而次品率p=m/10000也未知.要确切地知道p,必须对这10000件逐一进行检验.这不仅是不经济的,且往往无法做到(例如,对导弹的检验是破坏性的,不可能逐一进行).因此我们只能从其中挑出一部分,例如100件,根据对这100件的检验结果去估计p.在这里,随机性的影响就表现在:哪100件被挑出是偶然的.在社会调查中,一般来讲所规定的调查范围都比较大,例如研究某地区以农户为单位的经济状况,则该地区的全体农户都是调查对象.若这个数目太大,则我们只能选取其中一部分作实地调查.这时,所得数据的随机性就来自被挑出的农户的随机性.对这种数据进行分析,就必须使用数理统计方法.数据随机性的另一种来源是试验的随机误差,这是指那些在试验过程中未加控制、无法控制,甚至未知的因素所引起的误差.例如,已知反应温度和压力是影响产品质量Y的重要因素,我们想通过一定的试验去考察其影响程度,并挑选一个适当的温度和压力值以供在今后大批生产中使用.但是,Y除了与温度、压力有关外,还受到大量其他因素的影响.例如,每次试验所用的原材料可能略有差异,所用仪器设备和操作者也可能不同等等.这些因素无法或不便加以完全控制,因而对试验结果(数据)产生随机性的影响,带来一种不确定性.例如,从试验数据上看,使用温度t2比用t1好,但这个表现在数据上的优势究竟是本质的(即有足够的理由可以解释为t2确实优于t1),还是只是随机误差的偶然性表现?这就需要用数理统计的方法去分析.2.关于“用有效的方式收集数据”一语中,有效一词的解释.归纳起来,“有效”表现在如下两个方面: (1) 建立一个在数学上可以处理并尽可能简单方便的模型来描述所得数据;(2) 数据中要包含尽可能多的、与所研究的问题有关的信息.例如,在考察某地区共10000农户的经济状况的问题中,我们前面曾说挑出100户作实际调查.100这个数字是否恰当?太大了则费用过大,太小了则代表性不够.要决定一个较好的数字,须权衡这两个方面,并且要用得着统计方法.其次,假定我们选择了100这个数字.这100户如何挑选?假设你只在该地区最富裕的那部分去挑选,则显然不具备代表性,更谈不上有效了.反之,你如果用一种随机化的方法,即设法使这10000户中的每一户有同等的机会被挑出,则所得数据就有一定的代表性,我们也不难建立一个简单的模型来描述它.在一些情况下,我们还可以设计出更有效的方法,例如该地区分成平原和山区两部分,前者较富裕且占全体农户的70%,则我们可规定,在预定要考察的100户中,有70户从平原地区挑,30户从山区挑,而在各自的范围内则用纯随机化的方式挑选.直观上我们觉得,这样得到的数据,比在全体10000户中用随机化方式挑选得到的数据更有代表性,因而也更“有效”.数理统计的理论证明确是如此.又如,在上述产品质量与反应温度和压力的关系中,怎样用有效的方式收集数据,问题更多.若可以使用的温度在t1 和t2 之间,压力在 和之间.首先,我们当然只

文档评论(0)

fangsheke66 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档