- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
统计概率的数学思想
《统计、概率的数学思想》
谢衷洁
第一讲
统计学最重要的概念总体样本,因为统计学是收集数据和分析数据的科学,就离不开数
据。
总体,什么叫做总体,我们要研究统计,我们在统计研究对象的全体,所以研究对象的
全体,我们管它叫做总体。
例如要研究海淀居民年平均工资收入的问题,总体就是按户口有工资收入的人的,年平
均工资收入数它的全体就是我们的研究的对象,这里头不论人种、性别、民族等等因素,所
以总体,不等同于海淀居民,有海淀居民,还有别的省市,我们研究的就是年平均工资收入
的全体,学校的230 名学生,要考察学生的体重状况,总体是什么,全体学生的体重数,比
方说,用公斤来说,这个它的体重这是我们研究的对象,它的全体就是我们研究的总体,而
不是学生本身,因为学生本身他还有性别民族身高等等其他的一些信息,当然,如果约定了,
认指一个学生就等同于指他的体重,如果做这样的约定的话,那我总体就是学生,那也未尝
不可,但心里头要明确这两者有所差距,所以一个是什么叫做总体。
下面要讲什么是样本,这个是非常麻烦的一件事情,简单地说,通俗地说,就是和主体
既有相同统计性质的一组相互独立的随机事件。注意,和主体具有相同性质的统计性质的而
且又相互独立的,而且他们是随机数不能是指定的。只有这三条性质,我们才能做样本,因
此作为样本来讲的话呢,特点就是什么呢,我们是希望通过较少样本的分析,来对总体做推
断,刚才讲了,检验,估计了,等等,预报,都是希望通过局部的观察,对总体的性质来做
普及推断,因此来讲,这个样本的抽取,必须很科学。
它必须要满足以下几条:
第一条,它必须是随机的,不能是事先指定的。
第二条有代表性,也就是说和总体的性质,我研究总体的性质是相当的。
第三条必须是相互独立,不能有依赖。
说他那个身高,1.5 米,我这儿就简单地写个1.4 米,不行,必须是独立出去,这四条,
很多是忽视,其实是非常要命的,只要你是科学地样本的获得以后这些数据,不得任意筛选,
合意的我就留着,不合意的,我就筛选,筛掉,当领导的就愿意做,有助于提高本省的什么
什么我留着,调查上来的话了,这个对我们的不利,完成今年指标不利,删掉了,可以吗?
不可以,会出大事情的,历史上有很多影响以上的统计规律出现的大问题,我讲两个例子,
第一个非常著名的一个是美国的文学摘要,它的话,我们这个统计学里头经典的例子,反面
例子,当年的时候是罗斯福和兰登,竞选总统,这个文学摘要来讲是失败的预测,它自己
1916 年以来,历届的总统选举都准确地预报,说它的奢望很高,销售量很宽,这个,但是
1936 年的时候,大选当中,是由罗斯福和兰登对决,的确是来讲,调查了注意看230 多万
人,这个数目相当地大调查,最后预报是兰登获胜,可是事件选取的结果当中,罗斯福却是
多出1000 多万张票,获胜,这么大的偏差,这个杂志,这个就比较惨了,后来就倒闭了,
这是一个非常惨痛的教训,那犯了什么错误了,抽样法,他当时是按电话部,从电话部里头
来随机点名来记处,调查问卷懂吧,还有一个是从俱乐部的名册来头来随机点名,但是1936
年的时候,电话平均3 个家庭才有一部电话,因此很多穷人是不在考虑之内的,俱乐部也不
是穷人能够随便加入的,因此它的抽样是有偏抽样,230 多万人,难道抽样数还不够吗?
记住我们统计学一个非常重要的教训,假如抽样是有偏的,更多的抽样只能是在重复基
本的错误。就不要以为打样是对的,不一定的,你有偏抽样越多,你就是不断地在重复着错
误。这个盖伦(同音)很厉害,现在做到中国来了,盖伦(同音)来讲,它的只用了5 万个
人,你那几百万人,我就用了5 万人,正确地预报了刘师傅要获胜,误差只有6% 。盖伦(同
音)的方法是非常科学的,它的抽样是非常科学的,那么 1948 年大家还可以看,还剩好被
而(同音),肯尼迪、约翰逊、尼克松、卡特、里根、不什,大家看这两者预测跟实际的结
果,非常地积极,有时候全美国才收的3000 多人,他就敢作于保,而且得出了很准确的结
果,所以大家可以看出来,抽样这个环节,非常非常地关键,所以我们看见你们理论硕士,
初一的时候,就叫学生去抽样,站在门口,找谁抽,我就很害怕,因为抽样对我们来讲是非
常地严肃,很害怕的一件事情,一旦有偏就是这个问题,所以,我不太同意,让学生在街上
做一些问卷,然后就说怎么怎么,前些日
文档评论(0)