吴喜之-统计学基本概念和方法-第一章.ppt

吴喜之-统计学基本概念和方法-第一章.ppt

  1. 1、本文档共65页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
统计软件 SPSS:这是一个很受欢迎的统计软件;它容易操作,输出漂亮,功能齐全,价格合理。对于非统计工作者是很好的选择。 Excel:它严格说来并不是统计软件,但作为数据表格软件,必然有一定统计计算功能。而且凡是有Microsoft Office的计算机,基本上都装有Excel。但要注意,有时在装Office时没有装数据分析的功能,那就必须装了才行。当然,画图功能是都具备的。对于简单分析,Excel还算方便,但随着问题的深入,Excel就不那么“傻瓜”,需要使用函数,甚至根本没有相应的方法了。多数专门一些的统计推断问题还需要其他专门的统计软件来处理。 SAS:这是功能非常齐全的软件;尽管价格不菲,许多公司还是因为其功能众多和某些美国政府机构认可而使用。尽管现在已经尽量“傻瓜化”,仍然需要一定的训练才可以进入。对于基本统计课程则不那么方便。 统计软件 S-plus:这是统计学家喜爱的软件。不仅由于其功能齐全,而且由于其强大的编程功能,使得研究人员可以编制自己的程序来实现自己的理论和方法。它也在进行“傻瓜化”以争取顾客。但仍然以编程方便为顾客所青睐。 R软件:这是一个免费的,由志愿者管理的软件。其编程语言与S-plus所基于的S语言一样,很方便。还有不断加入的各个方向统计学家编写的统计软件包。同时从网上可以不断更新和增加有关的软件包和程序。这是发展最快的软件,受到世界上统计师生的欢迎。是用户量增加最快的统计软件。对于一般非统计工作者来说,主要问题是它没有“傻瓜化”。 统计软件 Minitab:这个软件是很方便的功能强大而又齐全的软件,也已经“傻瓜化”,在我国用的不如SPSS与SAS那么普遍。 Statistica:也是功能强大而齐全的“傻瓜化”的软件,在我国用的也不如SAS与SPSS那么普遍。 Eviews:这是一个主要处理回归和时间序列的软件。 GAUSS:这是一个很好用的统计软件,许多搞经济的喜欢它。主要也是编程功能强大。目前在我国使用的人不多。 FORTRAN:这是应用于各个领域的历史很长的非常优秀的编程软件,功能强大,也有一定的统计软件包。计算速度比这里介绍的都快得多。但需要编程和编译。操作不那么容易。 MATLAB:这也是应用于各个领域的以编程为主的软件,在工程上应用广泛。编程类似于S和R。但是统计方法不多。 想想看 举出你所知道的统计应用例子。 举出日常生活中随机性和规律性的例子。 你使用过统计软件或者利用过其他软件中的统计功能吗?你有什么经验和体会? * :1, 1, 3 案例分析(魅力) 比如有两条这样的新闻,他们都是关于高压电线是否会导致附近的儿童得白血病,它的理论是因为电流会产生磁场,磁场往往会引起白血病,所以生活在有电的环境里,会使人暴露在磁场中,那么住在高压电线附近,会增加这种暴露的程度。第一条 新闻是找了一位能说会道的母亲,她的孩子得了白血病,刚好她家就在高压电线附近,因此这位母亲向观众介绍了在高压电线附近是如何的危险这一情况;另一条新闻呢,是国家癌症所的一则报道,他们用了5年的时间和100万资金,走访了全国十几个省进行高压电线附近的儿童白血病情况的调查,最后得出结论,在白血病和暴露在高压电线所在的磁场之间,找不到任何的相关关系。 那么对于这样的两条新闻,我想一般的观众都会倾向于后者,这主要的原因可能就是在于统计数字的魅力,人们往往对具有统计数字的新闻和文章都比较信服。 案例分析(方式) 某个机构花费了很多的资金在某一城市做一个调查,他们将城区分成两个部分,一个上层区,一个下层区,分别对应工资的高与低,目的是想了解,哪个层区的住户更加注重资源的回收,他们所采用的度量变量就是路边资源回收垃圾每周的重量。结果得出上层区均超过下层区,由此,这个机构得出结论认为上层区的居民更加注重资源回收。 那么对于这样的数据报告,我们就要表示怀疑了,事实上,这个事件的本身是跟这个机构的分析结果不符合的。因为上层区在丢回收箱的物品都比较重,而下层区的就比较轻,比如单拿饮料来说,上层区的多半的丢入的是玻璃瓶的酒,而下层区的丢入的多半是塑料的饮料。这样的话,单单从重量上来比较,统计数据就不是那么有效了。 案例分析(质量) 当我们看到一则新闻和一篇统计报告的时候,往往不知道它的样本是如何取得的,这样就给文章的可信度打了折扣。样本也有好样本和坏样本的区分。我们首先来看看坏样本,比如:我们要检查一车桔子是不是优质的,那么最容易的方法就是在摆在每箱最上面的桔子中抽取,然而这样得出的结论就值得怀疑了,首先在运送的过程中,在下部的桔子是最容易受到碰撞的,其次如果供货商也了解这一点的话,把最好的桔子都放在上部,那么对于这样的统计结论就没有很大的意义。这样的果,我们用统计学的术语来说是,有偏的。也就是说样本的情

文档评论(0)

shaoye348 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档