- 1、本文档共21页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
5一门应用广泛的学科——应用统计
一门应用广泛的学科——应用统计(上)
北京大学教授 博士生导师 谢衷洁
主讲人
谢衷洁:1959年毕业于北京大学数学力学系概率论专业,毕业后留校任教至今,现任北京大学数学学院博士生导师,兼任中国概率统计学会副秘书长及该学会时间序列专业委员会主任,北大数理统计研究所副所长。
什么是统计学?对于统计学有一个相当好的叙述,那就是《不列颠百科全书》中讲到的一句话:“统计学是关于收集和分析数据的科学和艺术。”首先,统计学是一门科学,重点在于收集数据和分析数据。这种收集和分析数据不是对一般的数据进行分析,实质上是只讨论那种具有随机性的数据,即对偶然现象里面的统计规律进行分析。另外,需要指出,收集数据是大有学问的。是全体收集,还是部分收集?就部分收集来讲,应该怎样收集?下面我会列举一些情况来说明收集不好的话会闹出笑话,而且得到的结论也会是错误的。至于谈到艺术,就我个人理解,这里所谓的艺术当然不是文艺中的那个艺术,而是指科学中统计学的技巧和魅力。这种技巧和魅力是很吸引人的。
我们知道偶然现象不仅普遍存在,而且有内在规律,虽然通过一次观测它可能是捉摸不定的,但是经过大数量的观察后,它就会呈现出一种内在的规律性。恩格斯是这样看待这个问题的:在表面上是偶然性在起作用的地方,这种偶然性始终是受内部的隐蔽着的规律支配的,而问题是在于发现这些规律。——我想经典著作家对偶然性的这个阐述是很正确的。
我们从比较基本的问题谈起,偶然现象有规律吗?答案是肯定的。首先,什么叫偶然现象,什么是偶然事件?在数学上,想要有一个既通俗又严谨的严格定义,就要参考苏联的译本很好的书《概率论教程》中的定义:“在一组条件组Ω实现之下,事件A可能发生,也可能不发生,则称事件A为随机事件;若在Ω之下,A必然发生,则称A为必然事件;若在Ω之下,A一定不发生,则称A为不可能事件。”一般来说,这种必然事件与不可能事件这两者之间是互逆的。因为如果一个事件是必然事件,那么它的反面事件就一定不会出现;如果一个事件一定不会出现,那么它的反面事件就一定要出现。例如,我们在中学物理中学过,如果是这样一些条件:纯水、标准大气压、加热到100℃,那么沸腾现象一定会出现。所以它是必然事件。另一个是买体育彩票的例子,不重复地写出从01到36的7个数,想中二等奖就不一定了,可以发生也可以不发生,这就叫随机事件。尤其是跟偶然现象打交道时,一定要确立这样一个信念:可能性的大小是客观存在的,是不以人的意志为转移的。我们用一个叫做“概率”的数值来度量这种可能性的大小,例如,我们可以问这样三个问题:第一个问题,任选北京10月份的某一天,它的最低气温小于25度,这有可能发生也可能不发生;第二个问题,掷一枚硬币会出现国徽;第三个问题,任查街上的一个人,他的心脏在右边,这是有可能的。如果第一个事件出现的概率为,第二个事件出现的概率为,第三个事件出现的概率为,凭经验我们马上会排出这样一个次序:大概是小于,大概小于。为什么呢?因为凭经验来讲,到10月份北京已经比较凉爽了,气温小于25度大概总是没有问题的,所以概率接近l,就是几乎100%。而对于一个硬币来讲,掷出国徽的概率大概是50%。对于来说,既然大家说有可能,那应该是多少呢,大概我们很难回答这个问题。所以,我们研究概率有一种方法,就是如何从数据出发来研究这个偶然现象。
想必大家都知道投掷硬币出现国徽的问题,在历史上已经有很多人做了很多实验。其中比较有名的实验都是著名的统计学家做的,一个是莫岗,他投掷2048次,出现国徽1 061次,比例是0...﹒.﹒../的变化,一开始是很不稳定的.但随着的增长,这个比例/越来越接近这条0 ./.....
为了讲清楚下面的应用,我先讲一个大家很熟悉的定义——古典概型。古典概型,简而言之就是,假定做一个随机实验,在这个随机实验的对象中,它的结果只有有限多种,,…,,这些的地位是平等的、对称的,没有哪个特别容易出现。另外,最重要的是它们两两互相排斥,即出现,就不会出现,出现就不会出现,如投掷硬币时,出现正面就不会出现反面(当然不考虑硬币竖立不倒的情况)。所以,如果我们讨论其中的某一个事件出现的概率/,就是在这个事件当中包含有多少个,假定包含个,那么出现的概率就是/来讲,其中可以是2、4、6这三种点数,因此概率是3/6,等于 1/2。
上述例子比较好理解,可以讲快一点,重要的是下面这件事情,就是在全体当中占多少,它的百分比就作为它的概率,这个古典概型有人把它延伸到几何概率上去。即假设在平面上有一个点是(x,y),假定(x,y)这个点在一个[A,B]*[C,D]矩形上均匀分布(假定它是均匀分布的),即这个点在这个矩形上任意一点都有可能出现。假设这个矩形的面积为S,而在这个矩形里边有一块区域叫做D,它的面积是G,那么在我的一
文档评论(0)