第1章节 概率统计简介.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第1章节 概率统计简介

第1章 概率统计简介 胡良剑 东华大学理学院 Ljhu@ 第2学院楼543 内容提要 什么是统计学 一个例子: 学生体检数据分析 统计学的昨天、今天和明天 什么是统计学 Statistics is the study of the collection, organization, analysis, interpretation and presentation of data. When analyzing data, it is possible to use one of two statistics methodologies: descriptive statistics or inferential statistics. ----维基百科() 统计学的主要内容 描述统计学(Descriptive statistics, 第2章) 概率论(Probability , 第3-6章) 推断统计学(Inferential statistics , 第7-8章) 一个例子 为了研究东华大学毕业生身体情况, 体育部随机抽查了90名男同学身高、体重数据, 记录在Excel文件体检数据.xls-raw中. 考虑下列问题: 这90名男同学的身高、体重具有怎样的特征? 是否可以据此估计:东华大学毕业男生平均身高、体重?需要作怎样的假设? 概念 总体(Population):当年东华大学毕业男生(约1800名); 样本(Sample):90名学生; 变量(Variable): 学号、学院、身高、体重等; 观察值(数据)(Data):变量的值 统计推断(Inference):根据样本(Sample)推断总体(Population) 。 数据类型 数值型(Numerical): 身高Height(cm), 体重Weight(kg); 名称型(Named): 序数型(Ordinal): 学号Code, 名义型(Nominal): 学院College. 第1步:数据清理 去除、修补坏数据(Outlier)和缺失数据(Missing Data)(行数据: 删5行, 修改3行) ; 去除与问题无关的变量(列数据), 可保留部分标识列(删College,保留Code作标识); 得到体检数据.xls-trim 第2步:数据描述 这90名男同学的身高、体重具有怎样的特征? 图形描述 数字特征描述 Histograms 直方图 首次使用安装: Excel2003-工具-加载宏-分析工具库 Excel2010-文件-选项-加载项-分析工具库 统计工具使用: Excel2003--工具-数据分析-直方图 Excel2010-数据-数据分析-直方图 直方图(Histograms) 正态分布Normal Distribution 中间多, 两头小; 对称 中心特征 Median中位数: 上、下观察值占50% Mean均值: 算术平均 Mode众数: 具有最大频率的观察值 Variability 差异性(离散性)特征 Range 极差=最大值-最小值 Quartile 四分位: Q0~Q4比该数小的观察值占0%, 25%, 50%, 75%, 100% Interquartile range 四分位差=Q3-Q1 Standard deviation 标准差: 距离均值的平均误差 Skewness 偏度: 偏度小于0时, 表明medianmean Percentile 百分位数: 指定比例的分位点 用Excel计算 方法1: Excel2003-工具-数据分析-描述统计 Excel2010-数据-数据分析-描述统计 方法2: Excel2003-插入-函数-统计-(选所需函数) Excel2010-公式-插入函数-统计-(选所需函数) Excel描述统计 第3步:统计推断 是否可以据此估计:东华大学毕业男生平均身高、体重?需要作怎样的假设? 前提假设(1)样本量90个对于总体( 约1800个东华大学毕业男生)来说足够大;(2) 90个样本是从总体中随机抽取的,使得每个个体被抽到的可能性是一样的。 统计推断由样本推断总体:平均身高173cm,平均体重60kg。 前提假设非常重要 随机电话调查(习题2):1936年的总统竞选中罗斯福以压倒性的优势击败了兰登,而《文学文摘却预测兰登获胜,该杂志的预测就基于一个机动车主的电话簿的样本进行的。 你是如何看待《文学文摘》的预测错误? 从1936年至少的时代变迁中,有没有什么因素让您认为当时《文学文摘》所用的方法在今天来讲预测情况会好一些? 统计学的历史 起源:统计学的英语词statistics是源于意大利语statista(国民或政治家),代表对国家的数据进行分析的学问,也就是“研究国家的科学”。 先驱者:

文档评论(0)

ctuorn0371 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档