- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
推荐一本概率统计的写的比较好的书
现在看来在中国,中文的教科书可不是越厚越好,似乎已经成了一种和国外相反的趋势,厚的书以盈利为目的,薄的书才可能是教书育人的。大学的那本概率统计书似乎就是这样的一个很好的例子,忘了是哪个地方出的,反正好像很多大学都用的,很厚,封面有点浅蓝色。Anyway,不爽的就让它过去吧,虽然我花了很长时间在那本书上也没搞清楚它在讲什么。现在隆重推出《概率统计》,同济大学工程数学教研室编,由同济大学出版社出版,封面上还写有函授自学教材。我手上的(图书馆借的)是99年的第一版,才14块,绝对的划算,书也不厚不薄,正好包含了它应该有的内容。
这本书最出彩的是他第五章开始的数理统计的讲解,和很多其它书不同,这本书抓住了统计的精要--统计是用于实践的。内容处处与实践相结合,显示出了数学是实践的强大工具。
下面是我摘要的个人感觉讲的比较好的地方(也是我以前看垃圾书一直搞不懂的地方,不过我考试确能很好的通过,这也是我搞不懂的地方,中国教育这个垃圾)。
1,什么是数理统计
数理统计方法实际上就是数据处理的方法,与其它数学科目不同,它注重的是对实际工程中获得的不理想的数据的处理,使其尽量理想化。
比方说你想知道世界上是漂亮女人多还是丑的多,那么我们可以做这么一个实验。随便找一天上街,然后把看到的所有年轻女人进行你心目中的评分,然后计下来,下面是我做的这么一个实验数据(比较衰,这天没看到几个漂亮的),1表示完美,0表示极丑,0.5为中等。
0.9 0.5 0.4 0.4 0.8 0.5 0.6 0.3 0.5 0.5 0.4 0.6 0.7 0.4 对这组数据最简单的处理就是取其平均值,不过在此之前,先看看数据的特性。
数据值 频数 0.0 0 0.1 0 0.2 0 0.3 1 0.4 4 0.5 4 0.6 2 0.7 1 0.8 1 0.9 1 1.0 0 要注意,频数和频率在概率论里是两个不同的概念,频数是指其数据在实际实验中出现过的次数,而频率是理论或者实际试验后处理过的数据(工程中用频数除以数据的总数作为频率或者讲概率的一个估计)。有兴趣的读者可以用word把上面的数据作个条形图看看数据的分布,很有趣的。
O.K.现在我们看看我们的数据可以带给我们什么样的结果呢,对数据做和然后求平均,
*(0.9+0.8+0.7+0.6*2+0.5*4+0.4*4+0.3)=0.536
Well,结果似乎还是令人满意的,说明对我来说这个世界的年轻女人长得还是可以的,不致于我要出家当和尚(我要求是不是很低啊)。
好了,上面就是我们所做的统计的最初之旅,有点简单但是很实用。不过细心的读者可能会发现,实际上我的这个结论是极其不可靠的,因为首先我只是对几个女人进行评价,从而得出了一个对整个世界女人的评价,即使这个方法是合理的,也顶多能判断中国或者上海女人符合这个判断。还有我采用的评价公式是否是合理的,为什么只取平均,而不是其它的值。很显然统计这门学科就是要研究如何采集数据,以及分析数据,以及数据能对对象的什么特性进行评价的一门学科。
2,总体和样本的概念
说实话,在看到这本书之前(本科学这门课到研究生第二年,靠,考研显然也是垃圾,我照搬公式就搞定了),我对这个概念一直是搞不清(我觉得不能怪我,责任都在我的大学体制和那本垃圾教科书)。但是这是要看懂后面概念所最基本的,这里我作个详细介绍,当然你也可以看我上面推荐的那本书。
在数理统计中,我们把研究对象的全体称作总体,而其中的每个成员看作个体。在上面的那个例子中,全世界的年轻女人就是总体,单个女人就是个体。一般来讲,捕获全体是不现时的,就像我不可能看过全世界的所有女人,所以个体就变得十分重要。好的个体能很好的包含总体的属性,不过一般来讲,个体总能包含总体的属性,只是多和少罢了。在实际的工程中,我们常常只是把自己感兴趣的指标X视为总体,如上面例子,对总体的进一步抽象就是全世界年轻女子的样貌作为总体。
在实际应用中,常常可以看到别人使用了积分的一些表达式,这是因为从统计的角度来说,人们更喜欢使用密度这个概念,这样如果计算对象随某一变量实时变化那么我们就可以用积分来计算这个对象了。这里我们把这个密度函数称作分布函数,一般对于总体X,叫做X的分布函数,当X是连续型的随机变量时,叫做总体密度函数,如果是离散的,就叫概率函数。
在实际工程中,总体的分布函数总是未知的(知道了就不要用统计了),但可能其分布类型为已知,而只是其中参数未知,那么通过样本分析得到这些参数的统计推断就构成了参数统计的内容,如果连分布类型都不知的化,那么就是非参数统计了,显然后者更复杂一点。
一般的,如果总体包含的个体个数很多时,我们常常将其认为是无限总体来进行近似,比如上面那个例子中,全世界的年轻女人太多,
文档评论(0)