- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2014级新生专业教育发言稿
2014级统计学专业新生学业教育
——了解统计、走进统计
我们统计教研室共有7名专任教师,其中教授一名(毛院长:西藏经济统计方面的著名专家),副教授两名,具有硕士学位的5名。
一、统计学的重要性
统计学专业对大家来说,其实并不陌生。一方面,大家在小学、初中、高中专门学过一些统计知识(国家教改要求),如平均、标准差、概率等;另一方面,在生活中,我们处处可见统计,“统计”这个词在我们生活中出现的频率极高,我们干什么多喜欢“统计”一下,喜欢拿数字说话,喜欢搞量化。那怎么量化,数字怎么来的,就需要统计了,统计就是跟这些数字打交到的,例如:
1.评价问题(满意度的评价、人的评价、工作业绩评价、综合国力的评价等);
2.质量控制(我的同学正在专攻统计)、产品的保质期;
3.医学实验、化工生产;
4.体育(NBA、奥运、足球等);
5.互联网(人工智能、模式识别等);
6.社会、经济的各个方面(GDP、人口(计划生育政策)、人民生活(恩格尔系数)、社会稳定(基尼系数)):获得诺贝尔奖的经济学家中有2/3直接跟统计有关。
所以统计普通到我们随处可见,普通到你用了它,你还不知道你是在做统计,你是具备统计知识的。这正如一些人说,“统计”太普通了,普通到就像一瓶矿泉水,你很多时候感觉不到它的存在,但有时候到了关键时刻,你就会猛然意识到,统计是如此的重要,(比如说在沙漠中),没有它,你活不了。这句话是一位搞生物统计学的博士后寻找合作伙伴的时候,对我们这些搞统计的人说的,最后他还说到:“我在沙漠中等着你来救命”。
当然,关于统计的重要性,不仅仅在于它的应用上,还在于对它的理解上。我们现在很多事情都是用统计、用数字来表述的,那这样,你就要懂得它的手段,理解它的数字。例如一则广告说:“戴镜两小时近视降低100度”。看到这,你就注意了,数字的很多前提条件没有标出来。像这样滥用统计的还有不少,因此,大家要特别注意。再比如一条河的旁边标示着:“河的平均深度只有0.7米”,那你就要注意了,不要光看0.7这个数字了,否则,后果可能不堪设想了。所以啊,很多时候大家觉得统计会骗人,平均数会骗人,就像有人曾经说过:“世界上的说谎者倚罪孽轻重可以分为三类,说谎者、糟糕透顶的说谎者和统计学家。”之所以会这样,主要原因有两个:一个是世人滥用统计,另一个是对统计的理解有问题。所以学好统计,十分重要。
二、什么是统计
说了这么多,还有一个关键的问题,我们还没有说,那就是什么是统计,关于什么是统计,我刚才也说了,大家基本都接触过,大家心目中都可能有自己的理解,这里我说一下我个人的理解和看法,首先,统计是跟数打交道的,其目的就是通过数据去探索对我们有用的信息。它有一整套流程,搜(收)集、整理、分析和表述(数据)。
(一)搜集
搜集就是要得到数据,没有数据,我们就只能使劲地拍着脑袋去说了,可就算把脑袋拍破了,可能都没有人敢相信你,因为太不精确,太不靠谱了。那数据怎么来,获得数据的主要方式有两个,一个是调查,另一个是试验。调查说起来简单,做起来往往很艰辛(你们以后做调查就知道了)。当然如果有统计学的指导,我们也会发现一些让人变聪明的技术,举个例子,对于吸毒问题,一般都会低报(不愿意告诉访员自己吸毒),对于这种情况我们该怎么处理?暂且把悬念留在这里数据不是说上来就可以马上作分析,有实践经验的人都知道,在数据的过程中,总会有各种意想不到的情况发生,但也是天要下雨娘要嫁人没办法的事情,你总不能把那些在问卷上偷懒空着不填或者乱填一气的同志们抓来严刑拷打。空着调查项目不填写的我们称之为缺失值(Missing Value),胡乱填写的可能成为离群点或野值(Outlier),对于这样的数据,我们应该事先做一些处理才能进行下一步的统计分析,不然会对统计结果产生一些不良影响,这些道理想想就能明白。关于缺失值的处理,目前已经发展起来比较完备的插补技术(Imputation),这里面包括均值插补、热平台插补、冷平台插补、最近邻插补、EM算法、Bootstrap、Jackknife、MCMC(Monte-Carlo Markov Chain)等知识。对于数据中的离群点,也要先思考一下,不要轻易删除,在离群点中反而有可能隐藏对我们有启发的信息(比如一位同学的学分绩太高以至于成了“野值”,我们就不能把他/她从班里“删除”,而应该借鉴学习经验)。不可否认,当今社会对于统计的需求,大部分都在于这一块。统计软件输出的P值活生生拿给别人看,八成会被殴;你要是胆敢告诉人家聚类分析碎石图上石头的位置表示特征根的大小,被扁的概率将一致趋近于1。Python、Hadoop等大数据分析软件上也是比较容易的。
五、关于统计就业
这是大家比较关心的问题。近些年统计就业形式还是比较好的,其需求目前呈井喷式增长,目前已经称为
文档评论(0)