lecture1课件1.pptVIP

  1. 1、本文档共37页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
常用统计方法 华东师范大学统计系 2007年3月 讲义下载:统计系主页之下载专区 答疑安排: 时间:每周四课后及晚上。 地点:理科大楼A座1613室。 考核方法 出勤率及课堂表现,占10%; 平时作业,占20%; 课程论文,占30%; 期末考试,占40%。 本课程的基本内容 基本概念 数据的收集 数据的描述 概率和分布 简单统计推断--估计和检验 相关和回归分析 列联表和对数线性模型 方差分析 主成分分析和因子分析 聚类分析 判别分析 时间序列分析 第一章 基本概念 一、随机性和规律性 2、随机性与规律性 随机事件的随机性体现在一次事件发生前,其最终结果的不确定性。例如,抛一枚硬币,我们事先并不能确定其结果一定是“正面朝上”。但是,当这一种事件大量重复发生时,其结果又带有一定的规律性,这种规律性通常称为统计规律。 二、统计学的定义 关于统计学(statistics)的定义有很多种不同的叙述,最常用的一种定义是这样的: 定义1.1. 统计学是一门研究随机现象及其规律性的科学。 三、可能性与概率 在单独的一次观察或试验中,一个随机现象可能出现也可能不出现,根据情况不同,这种可能性(possibility)或大或小,且通常可以通过数字来量化,如例1.3中的“一半”、“60%”和“30%”等。在统计学中,这种量化了的可能性称为概率(probability)。 有些概率是可以精确估算的 比如掷骰子。只要没有人在骰子上做手脚,你得到6点的概率应该是六分之一。得到其他点的概率也是一样。 得到6点的概率或者机会是可以知道的,但每次掷骰子的结果还只可能是六个数目之一。 这个已知的概率就反映了规律性,而得到哪个结果则反映了随机性。 如果你掷1000次骰子,那么,大约有六分之一的可能会得到6;这也是随机性呈现有规律的一个体现。 有些概率是无法精确推断的 比如你对别人说你下一个周末去公园的概率是百分之八十。但你无法精确说出为什么是百分之八十而不是百分之八十四或百分之七十八。 其实你想说的是你很可能去,但又没有完全肯定。 实际上,到了周末,你或者去,或者不去;不可能有分身术把百分之八十的你放到公园,而其余的放在别处。 四、变量 做任何事情都要有对象。比如我们班上注册的学生有40人,这是一个固定的数目,称为常数(constant)或者常量。 但是,如果猜测今天这个班有多少人会来上课,那就没准了。这有随机性。可能有请病假或事假的,也可能有逃课的。这样,将会来上课的人数是个变量(variable),也称随机变量(random variable),常缩写为r.v.。 另外对于某项政策同意与否的回答,也有“同意”、“不同意”或者“不知道”三种可能值;这也是变量,只不过不是数量而已。 四、变量(续) 当变量按照随机规律所取的值是数量时该变量称为定量变量或数量变量(quantitative variable);因为是随机的,也称为随机变量(random variable)。 象性别,观点之类的取非数量值的变量就称为定性变量或属性变量或分类变量(qualitative variable,categorical variable)。 这些定性变量也可以由随机变量来描述,比如男性和女性的数目,同意某政策人数的比例等等。 只有当变量用数量来描述时,才有可能建立数学模型,才可能使用计算机来分析。 五、数据 有了变量的概念,什么是数据呢? 拿掷骰子来说,掷骰子会得到什么值,是个随机变量。 而在实际掷骰子过程中,如果掷100次,会得到100个由1至6点组成的数字串;再掷100次,又得到一个数字串,和前一次的结果多半不一样。这些试验结果就是数据。 数据与变量的关系:数据是关于变量的观测值. 通过数据可以验证有关的理论或假定(比如每一次得到每个点的概率是不是1/6等等)。 六、变量之间的关系 变量与变量之间往往是有一定联系的。比如某商品的广告投入与销售量之间存在一定的正比关系。 变量之间的关系往往通过数据来描述。(祥见第七章) 变量之间的关系一般来说不是某种确定的关系。比如广告投入与销售量之间,并不是说广告投入每增加1万元,销售量就一定增加几(某个确定的量)万元。它们之间的比例关系有一定的误差(error)。 不仅仅数量变量之间有一定的关系,定性变量与定性变量、以及数量变量与定性变量之间也可能存在一定的关系。比如身高(数量变量)与性别(定性变量)之间就存在一定的关系。 七、统计和计算机 计算机现在已成为百姓生活的一部分。 统计软件的发展,也使得统计从统计学家的圈内游戏变成了大众的游戏。只要你输入你的数据,点几下鼠标,做一些选项,马上就得到令人惊叹的漂亮

文档评论(0)

mwk365 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档