- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第1章 概率统计简介 胡良剑 东华大学理学院 Ljhu@ 第2学院楼543 内容提要 什么是统计学 一个例子: 学生体检数据分析 统计学的昨天、今天和明天 什么是统计学 Statistics is the study of the collection, organization, analysis, interpretation and presentation of data. When analyzing data, it is possible to use one of two statistics methodologies: descriptive statistics or inferential statistics. ----维基百科() 统计学的主要内容 描述统计学(Descriptive statistics, 第2章) 概率论(Probability , 第3-6章) 推断统计学(Inferential statistics , 第7-9章) 一个例子 为了研究东华大学毕业生身体情况, 体育部随机抽查了90名男同学身高、体重数据, 记录在Excel文件体检数据.xls-raw中. 考虑下列问题: 这90名男同学的身高、体重具有怎样的特征? 是否可以据此估计:东华大学毕业男生平均身高、体重?需要作怎样的假设? 身高与体重之间是否有依赖关联?是否可利用身高来估计体重? 概念 总体(Population):当年东华大学毕业男生(约1800名); 样本(Sample):90名学生; 变量(Variable): 学号、学院、身高、体重等; 观察值(数据)(Data):变量的值 统计推断(Inference):根据样本(Sample)推断总体(Population) 。 数据类型 数值型(Numerical): 身高Height(cm), 体重Weight(kg); 名称型(Named): 序数型(Ordinal): 学号Code, 名义型(Nominal): 学院College. 第1步:数据清理 去除、修补坏数据(Outlier)和缺失数据(Missing Data)(行数据: 删5行, 修改3行) ; 去除与问题无关的变量(列数据), 可保留部分标识列(删College,保留Code作标识); 得到体检数据.xls-trim 第2步:数据描述 这90名男同学的身高、体重具有怎样的特征? 图形描述 数字特征描述 Histograms 直方图 首次使用安装: Excel2003-工具-加载宏-分析工具库 Excel2010-文件-选项-加载项-分析工具库 统计工具使用: Excel2003--工具-数据分析-直方图 Excel2010-数据-数据分析-直方图 直方图(Histograms) 正态分布Normal Distribution 中间多, 两头小; 对称 中心特征 Median中位数: 上、下观察值占50% Mean均值: 算术平均 Mode众数: 具有最大频率的观察值 Variability 差异性(离散性)特征 Range 极差=最大值-最小值 Quartile 四分位: Q0~Q4比该数小的观察值占0%, 25%, 50%, 75%, 100% Interquartile range 四分位差=Q3-Q1 Standard deviation 标准差: 距离均值的平均误差 Skewness 偏度: 偏度小于0时, 表明medianmean Percentile 百分位数: 指定比例的分位点 用Excel计算 方法1: Excel2003-工具-数据分析-描述统计 Excel2010-数据-数据分析-描述统计 方法2: Excel2003-插入-函数-统计-(选所需函数) Excel2010-公式-插入函数-统计-(选所需函数) Excel描述统计 第3步:统计推断 是否可以据此估计:东华大学毕业男生平均身高、体重?需要作怎样的假设? 前提假设:90个样本数据是从总体( 约1800个东华大学毕业男生)中随机抽取的,使得每个个体被抽到的可能性是一样的。 统计推断由样本推断总体:平均身高173cm,平均体重60kg。 前提假设非常重要 随机电话调查(习题2):1936年的总统竞选中罗斯福以压倒性的优势击败了兰登,而《文学文摘却预测兰登获胜,该杂志的预测就基于一个机动车主的电话簿的样本进行的。 你是如何看待《文学文摘》的预测错误? 从1936年至少的时代变迁中,有没有什么因素让您认为当时《文学文摘》所用的方法在今天来讲预测情况会好一些? 抽样调查方法 随机抽样 分层抽样 整群抽样 相关性 身高与体重之间是否有依赖关联?是否可利用身高来估计体重? Excel计算 Excel2003-工具
您可能关注的文档
- 《电子商务概论》第1讲 电子商务概述.ppt
- 《电子商务概论》第3讲电子商务的网络依托.ppt
- 《电子商务概论》第7讲 电子商务安全.ppt
- 《港粤口头禅趣解》饶原生著.ppt
- 《信息技术支撑下校本研修方式的研究》课题研究中期工作报告.ppt
- 《学校校本研修实施方案》设计.ppt
- 《英语》新标准教学问题与思考孙晓奎外语教学与研究出版社.ppt
- 《政治生活》学考复习的建议.ppt
- 【报告题目】 CAPS Storm-Scale Ensemble Forecast Project.ppt
- ②合理安排财政支出总的:尽力做到收支平衡,略有结余;.ppt
- 山东济南信息技术模拟考试卷含答案(5篇).pdf
- 人教版小学数学二年级下册第八单元《克和千克》单元测试(I)卷.pdf
- 2026中国国际工程咨询有限公司总部校园招聘备考题库最新.docx
- 人教版六年级下册数学第三单元《圆柱与圆锥》测试卷(含答案).pdf
- 护士条例考试试题及答案.pdf
- 2025黑龙江齐齐哈尔市铁锋区选调(招聘)“成手人才”56人备考题库附答案.docx
- (2025年)公务员公开选拔(遴选)面试真题及答案(七).docx
- 2025年新冠疫情防控培训测试题附答案.docx
- 2025年CCAA国家注册审核员考试(ISMS信息安全管理体系基础)测试题及附答案.docx
- 2025年河南信阳市国有资本运营有限公司招聘笔试备考试题及答案.docx
最近下载
- (153页)新统编语文小学语文三年级上册 第五单元全部课件包含习作.pptx
- 琯溪蜜柚的栽培与管理.pdf VIP
- 应变式加速度测试系统与信号处理设计.pdf VIP
- 中国水利水电建设股份有限公司海外业务安全生产、工程质量和环境管理办法.docx VIP
- 世贸组织全球贸易报告.docx VIP
- 健美操(华中农大)中国大学MOOC慕课 章节测验期末考试答案.docx VIP
- ANSI-AWS D1.1-D1.1M 2010 美国钢结构焊接规范 中文版.pdf
- 2025年锅炉试题库(附答案).docx VIP
- 《汉语教程(第三版)第一册 下》教案25 她学得很好.pdf VIP
- 海外工程质量管理办法.docx VIP
原创力文档


文档评论(0)