- 1、本文档共7页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
概率论与数理统计第16讲(夜大)
第三章 样本及抽样分布
一、什么是数理统计学
当我们用试验或观察的方法研究一个问题时,首先要通过适当的观察或试验以取得必要的数据,然后就是对所得数据进行分析,以对所提问题作出尽可能正确的结论,为什么说“尽可能正确”呢?因为数据一般总是带有随机性的误差。这里所说的数据误差,主要是指由于观察和试验所及,一般只能是所研究的事物的一部分,而究竟是哪部分则是随机的。例如师大学生身高问题,你从中抽出50人来研究,抽取的结果不同,所得数据就不同,这完全凭机会而定。我们说的随机误差重要是指这个来说的。由于数据带有这样的随机性,通过分析这些数据而作出的结论,也就难保其不出错了。分析方法的要旨,就在于使可能产生的错误越小越好,发生错误的机会越小越好,这就需要使用概率论的工具。
数理统计学就是这样一门学科:它使用概率论和数学的方法,研究怎样收集带有随机误差的数据,并在设定的模型(称为统计模型)之下,对这种数据进行分析(称为统计分析),以对所研究的问题作出推断(称为统计推断)。
例:某工厂生产大批电子元件。我们有理由认为假定元件的寿命服从指数分布,现在考虑:
1、元件的平均寿命如何?
2、如果你是使用单位,要求平均寿命能达到某个指定的数L,例如5000小时,问这批元件可否被接受?
在此,“元件寿命服从指数分布”提供了一个数学模型,即本问题的统计模型。如果你知道了该分布中参数的值,那么上面的两个问题就解决了。但在实际当中往往未知,于是我们就只好从这一批元件中随机抽出若干个,例如个,并测其寿命分别为,这个元件如何选取?主要是要保证这大批元件中,每一件有同等的机会被抽取,这并不容易,需要想一些办法(这不是我们这本教材讨论的内容)。
有了后,一个自然的想法是:用其算术平均值去估计未知的平均寿命。当然,不一定等于。但在实际问题中,我们不会也不可能要求所做的估计一丝不差。但是误差可能有多大?产生指定大小的误差的机会(概率)有多大?为了使这概率降至指定的限度(如0。1),抽出的元件个数应到多少(越大越精确)?这些问题的解决方法及有关理论,就是数理统计学的内容。
本例提出的第一个问题称为参数估计问题,因为是元件寿命中一个未知的参数,而我们的问题是要估计参数本身(当然也可以是关于的一个函数)。参数估计是最重要的统计问题之一。
现在来考虑第二个问题。可能认为:至少就本例而言,解决了第一个问题也就解决了第二个问题,因为,既然用去估计平均寿命,那就看是否小于指定的数L。若,则接受这批产品,否则就不接受。
应当说,这是一个可以考虑的办法。但还应注意到,因为估计平均寿命有误差,我们的根据实际需要进行一定的调整。即把接受的准则定为,是某个选定的值,可以大于、小于或等于L。定的大些,表示我们检验更严格,这在对元件质量要求很高且供货渠道较多时可能是适当的。反之,定得小些,表示检验更宽,这在对元件质量要求不高或急需这些元件而供货渠道很少时,也可能采取。从统计上说,无论你怎么定,理论上你都可能犯两种错误之一:一是元件平均寿命达到需求而被你拒绝了,一是元件平均寿命达不道需求而被你接受了。这两种错误各有一定的规律,它们在很大程度上决定了接受准则
中的选择。
第二个问题与第一个问题不同:它不是要求对分布中的未知参数作出估计,而是要在两个决定(就本问题而言是拒绝还是接受)中选择一个。这类问题称为假设检验问题,也是最重要的统计问题之一。
我们主要介绍这两种统计问题。
关于数理统计学,我们补充两点说明。
一、统计学是一门实用性很强的科学,其生命力和发展动力,在于它与实用学科之间的密切联系。割断了这种联系,统计学就会变成无源之水、无本之木,产生不出有意义的问题和方法。因此,统计学与其他学科和领域所形成的边缘交叉学科也很多,如工业统计学、农业统计学,生物统计学,医药统计学,可靠性统计与生存分析,人口统计学,数量经济学等等。
从统计学家本身而言,为了更有效地将统计学方法应用于某一领域,有必要对该领域有关知识有一定的了解。在某种程度上,用统计学方法解决问题好比医生给病人治病。好的医生要根据实际情况灵活地使用他的专业知识,并具备丰富的实践经验。从这个角度看,虽然不能讲统计学本身是一门艺术,但可以说,在一定程度上,统计学方法的有效使用是一门艺术。正因为此,《不列颠百科全书》对统计学下的定义:“统计学是关于收集和分析数据的科学和艺术”。但同样,它也带来了一定的负面作用。但要说明,这种负面因素,并非出自方法本身,而是由于方法的不当使用。
有人说:“什么是统计学家?统计学家是一群骗子,他们可以用数据证明任何想要证明
文档评论(0)