基本概念回顾S.ppt

  1. 1、本文档共108页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
统计基本概念回顾 现实中的随机性和规律性 中学时,就知道自然科学的许多定律,例如物理中的牛顿三定律,物质不灭定律以及化学中的各种定律等等。 但是在许多领域,很难用如此确定的公式或论述来描述一些现象。比如,人的寿命是很难预先确定的。一个吸烟、喝酒、不锻炼、而且一口长荤的人可能比一个很少得病、生活习惯良好的人活得长。 因此,可以说,活得长短是有一定随机性的(randomness)。这种随机性可能和人的经历、基因、习惯等无数说不清的因素都有关系。 现实中的随机性和规律性 从总体来说,我国公民的预期寿命却是非常稳定的。而且女性的预期寿命也稳定地比男性高几年。这就是规律性。 一个人可能活过这个寿命,也可能活不到这个年龄,这是随机的。 但是总体来说,预期寿命的稳定性,却说明了随机之中有规律性。这种规律就是统计规律。 概率和机会 你可能经常听到概率(probability)这个名词。最常见的是在天气预报中提到的降水概率。大家都明白,如果降水概率是百分之九十,那就很可能下雨;但如果是百分之十,就不大可能下雨。 因此,从某种意义说来,概率描述了某件事情发生的机会。 显然,这种概率不可能超过百分之百,也不可能少于百分之零。换言之,概率是在0和1之间的一个数,说明某事件发生的机会有多大。 有些概率是无法精确推断的 比如你对别人说你下一个周末去公园的概率是百分之八十。但你无法精确说出为什么是百分之八十而不是百分之八十四或百分之七十八。 其实你想说的是你很可能去,但又没有完全肯定。 实际上,到了周末,你或者去,或者不去;不可能有分身术把百分之八十的你放到公园,而其余的放在别处。 有些概率是可以估计的 如掷骰子。只要没有人在骰子上做手脚,你得到任何点的概率都应该是六分之一。 这反映了掷骰子的规律性。 但掷出骰子之后所得到的结果还只可能是六个数目之一。 这体现了随机性。 如果你掷1000次骰子,那么,大约有六分之一的可能会得到6;这也说明随机结果也具有规律;而且有可能通过试验等方法来推测其规律。 变量 做任何事情都有对象。比如一个班上注册的学生有200人,这是一个固定的数目,称为常数(constant)或者常量。 但是,如果猜测今天这个班有多少人会来上课,那就没准了。这有随机性。可能有请病假或事假的,也可能有逃课的。这样,将要来上课的人数是个变量(variable)。 另外对某项政策同意与否的回答,也有“同意”、“不同意”或者“不知道”三种可能值;这也是变量,只不过不是数量而已。 变量 当变量按照随机规律所取的值是数量时该变量称为定量变量或数量变量(quantitative variable);因为是随机的,也称为随机变量(random variable)。 象性别,观点之类的取非数量值的变量就称为定性变量或属性变量或分类变量(qualitative variable,categorical variable)。 这些定性变量也可以由随机变量来描述,比如男性和女性的数目,同意某政策人数的比例等等。只有当变量用数量来描述时,才有可能建立数学模型,才可能使用计算机来分析。 数据 有了变量的概念,什么是数据呢? 拿掷骰子来说,掷骰子会得到什么值,是个随机变量;而每次取得1至6点中任意点数的概率它在理论上都是六分之一(如果骰子公平)。这依赖于在掷骰子背后的理论或假定; 而在实际掷骰子过程中,如果掷100次,会得到100个由1至6点组成的数字串;再掷100次,又得到一个数字串,和前一次的结果多半不一样。这些试验结果就是数据。 所以说,数据是关于变量的观测值. 数据 通过数据可以验证有关的理论或假定, 比如通过多次掷骰子验证得到每个点的概率是不是1/6。 顾客是否喜欢某种饮品?事先不易猜测顾客喜欢与否的概率。在问了1000人之后,可能有364人说喜欢,而480人说不喜欢,其余的人可能不回答,或说不知道,或从来没有喝过这种饮料。当然,它仅仅反映了1000个被问到的人的观点;但这对于估计整个消费群体的观点还是有用的。 从该数据可以估计喜欢该饮料的人占大约0.364左右。 统计和计算机 人们越来越依赖计算机了。最早使用计算机的统计当然更离不开计算机了。 事实上,最初的计算机仅仅是为科学计算而建造的。大型计算机的最早一批用户就包含统计。而现在统计仍然是进行数字计算最多的用户。 计算机现在早已脱离了仅有计算功能的单一模式,而成为百姓生活的一部分。 计算机的使用,也从过去必须学会计算机语言到只需要“傻瓜式”地点击鼠标。结果也从单纯的数字输出到包括漂亮的表格和图形的各种形式。 统计软件 统计软件的发展,也使得统计从统计学家的工具变成了大众的游戏。只要你输入数据,点几下鼠标,做些选项,马上得到漂亮结果。 是否傻瓜式的统计软件的使用可以代替统计课程了? 数据的整理和识别,方法的

文档评论(0)

junjun37473 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档