- 1、本文档共37页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
统计学 ─从数据到结论 第一章 一些基本概念 §1.1 统计是什么? 统计是人类思维的一个归纳过程 站在一个路口,看到每过去20辆小轿车时,也有100辆自行车通过 而且平均每10个轿车载有12个人 于是,你认为小汽车和自行车在这个路口的运载能力为24:100 这是一个典型的统计思维过程 §1.1 统计是什么? 一般来说,统计先从现实世界收集数据(信息),如观测路口的交通 然后,根据数据作出判断,称为模型 模型是从数据产生的 模型也需要根据新的信息来改进 不存在完美的模型 模型的最终结局都是被更能够说明现实世界的新模型所取代 统计学可以应用于几乎所有的领域: §1.1 统计是什么? 一句话, 统计学(statistics)是用以收集数据,分析数据和由数据得出结论的一组概念、原则和方法。 以归纳为主要思维方式的统计不是以演绎为主的数学 统计可应用于各个不同学科,在有些学科已经有其特有的方法和特点;如生物统计(biostatistics)、经济计量学(econometrics)以及目前很热门的生物信息(bioinformation)和数据挖掘(Data Mining)的方法主体都是统计。 §1.2 现实中的随机性和规律性,概率和机会 从中学起,我们就知道物理学的许多定律,例如v=v0+at; F=ma等等 但是在许多领域,很难用如此确定的公式或论述来描述一些现象。 §1.2 现实中的随机性和规律性,概率和机会 一些现象既有规律性又有随机性(randomness) 肺癌患者中(主动或被动)吸烟的比例较大,这体现了规律性 而绝非每个吸烟的人都会患肺癌,这体现了随机性 §1.2 现实中的随机性和规律性,概率和机会 再如,一般来说,白种人身材比黄种人要高些,这就是规律性 但对于具体的一个白人和一个黄种人,就很难说谁高谁矮了,这体现随机性 §1.2 现实中的随机性和规律性,概率和机会 什么是概率(probability)? 新闻中最常见的是“降水概率” 从某种意义说来,概率描述了某件事情发生的机会。 显然,这种概率不可能超过百分之百,也不可能少于百分之零。 概率是在0和1之间(也可能是0或1)的一个数,描述某事件发生的机会。 §1.2 现实中的随机性和规律性,概率和机会 有些概率是无法精确推断的。 比如你明天感冒的概率 有些概率是可以知道的。 比如在打桥牌时得到一手黑桃的概率为1/635013559600,大约为1.574770×10-12(条件是洗牌均匀,没有作弊)。实际上得任何特定的一手牌的概率都是一样的,对吗? §1.3 变量和数据 一节火车车厢有多少坐位是一个固定的数目,称为常数(constant)或者常量。 但是,开车后,坐在这节车厢的旅客有多少就没准了。这有随机性。该车厢的乘客数为变量(variable)。 §1.3 变量和数据 一个学校的注册在校男女生比例是固定的,为常量 但是,该校任意一群学生的男女生比例就不一定和全校的比例一样了,它为变量(variable)。 §1.3 变量和数据 当变量按照随机规律所取的值是数量时该变量称为定量变量或数量变量(quantitative variable); 因为是随机的,也称为随机变量(random variable)。 如身高体重,购买某商品的人数等等 §1.3 变量和数据 象性别,观点之类的取非数量值的变量就称为定性变量或属性变量或分类变量(qualitative variable,或categorical variable)。 这些定性变量也可以由定量变量来描述,如男女生的数目,持有某观点的人数比例等等。 §1.3 变量和数据 定性变量只有用数量来描述时,才有可能建立数学模型,并使用计算机来分析。 数据中它们通常用哑元(dummy variable)代表,比如性别用0、1代表,三种收入用0、1、2代表(或用字母代表) §1.3 变量和数据 有了变量,何谓数据? 不同机构调查所得到的北京收入万元以上市民的比例都不一样,这是变量 而这些调查产生一些数目,这些数目就是数据(data) 数据是关于变量的观测值。 §1.3 变量和数据 通过数据可验证有关的理论或假定。 比如通过抽样调查验证美国选民对共和党候选人的支持率是否超过50% 通过抽样,可以检验某批产品是否合格等等 §1.4 变量之间的关系 现实世界紧密联系的 人们想知道投资方式和经济效益之间的关系、旅客人数和经济发展之间的关系等等 不讨论变量之间的关系,就无从谈起任何有深度的应用,统计的基本概念就仅仅是摆设而已。 §1.4.1 定量变量间的关系 例1.1.广告投入和销售之间的关系。下表(数据ads.txt)显示了某企业的广告投入和销售额之间的关系(万元)。 §1.4.1 定量变量间的关系 能否从该数据回答下面问题: 这两个变量是否有关
您可能关注的文档
- 火山与地震技术总结.ppt
- 火星上会有些什么技术总结.ppt
- 烘焙软件财务应用功能技术总结.ppt
- 红包课堂作文讲评技术总结.ppt
- 统计制程管制SPC研究.ppt
- 统计与SAS软件第五章线性回归研究.ppt
- 统计学原理研究.ppt
- 红筹回归及VIE架构拆除-蒋靖-150827技术总结.ppt
- 火灾事故案例技术总结.ppt
- 红对勾1-1-3技术总结.ppt
- 难点详解鲁教版(五四制)6年级数学下册期末测试卷带答案详解(考试直接用).docx
- 难点详解鲁教版(五四制)6年级数学下册期末试题【培优】附答案详解.docx
- 难点解析鲁教版(五四制)7年级数学下册期末试题及完整答案详解(全国通用).docx
- 难点解析鲁教版(五四制)7年级数学下册期末试题含完整答案详解(名师系列).docx
- 难点解析鲁教版(五四制)7年级数学下册期末试题含完整答案详解【全国通用】.docx
- 难点解析鲁教版(五四制)7年级数学下册期末试卷(突破训练)附答案详解.docx
- 难点解析鲁教版(五四制)7年级数学下册期末试卷(能力提升)附答案详解.docx
- 难点详解京改版数学9年级上册期中试卷附参考答案详解【突破训练】.docx
- 难点解析鲁教版(五四制)7年级数学下册期末试题含完整答案详解(有一套).docx
- 难点解析鲁教版(五四制)7年级数学下册期末试卷带答案详解(夺分金卷).docx
最近下载
- 减肥打卡社群运营.pdf
- 时间管理之四象限法则的运用PPT(59张)课件.pptx VIP
- Unit 5 Whose dog is it_ Part A Spell 课件人教版英语五年级下册.pptx
- 价值管理的信息系统开发.pptx VIP
- 装饰装修施工组织设计(完整版).pdf
- 模板专项施工方案(完整版).docx
- 《最后一片叶子》课件高教版中职语文基础模块上册.pptx
- 光合速率的测定方法讲课教案.ppt
- 电气控制与可编程控制技术课程设-三相六拍步进电机PLC控制系统的设计.docx VIP
- 2024-2025学年苏科版八年级物理下册 第9章 压强和浮力【速记清单】(解析版).pdf VIP
文档评论(0)