ch1导论分析.ppt

  1. 1、本文档共58页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
ch1导论分析

参考书 《统计学——基本概念和方法》,吴喜之等译,高等教育出版社,2000年版 《统计学的世界》[美国] 戴维 S 穆尔著,中信出版社:郑惟厚译,2003年 “没有统计,其它科学可以 存在,但是很渺小” 第 1 章 导论 第 1 章 导论 §1.1 统计基本问题 §1.2 统计数据的类型 §1.3 统计学中的几个基本概念 一、什么是统计学 1. 数据搜集:取得数据 2. 数据处理:图表展示数据 3. 数据分析:分析数据 4. 数据解释:结果的说明 statistics的定义(不列颠百科全书) statistics: the science of collecting, analyzing, presenting, and interpreting data. Copyright 1994-2000 Encyclopaedia Britannica, Inc. (不列颠百科全书) 统计研究的过程 统计规律(一些例子) 正常条件下新生婴儿的性别比为107:100 投掷一枚均匀的硬币,出现正面和反面的频率各为1/2;投掷一枚骰子出现1~6点的频率各为1/6 广告费用支出与产品销售收入之间存在相关关系 二、统计学的应用领域 三、统计怎么干 统计方法 描述统计与推断统计的关系 (一)定性数据和定量数据 分类数据(categorical data) 对事物进行分类的结果 数据表现为类别,用文字来表述 例如,人口按性别分为男、女两类 顺序数据(rank data) 对事物类别顺序的测度 数据表现为类别,用文字来表述 例如,产品分为一等品、二等品、三等品、次品等 数值型数据(metric data) 对事物的精确测度 结果表现为具体的数值 例如:身高为175cm、168cm、183cm (二)观测数据和实验数据 观测的数据(observational data) 通过调查或观测而收集到的数据 在没有对事物人为控制的条件下而得到的 有关社会经济现象的统计数据几乎都是观测数据 试验的数据(experimental data) 在试验中控制试验对象而收集到的数据 比如,对一种新药疗效的试验,对一种新的农作物品种的试验等 自然科学领域的数据大多数都为试验数据 (三)截面数据和时间序列数据 截面数据(cross-sectional data) 在相同或近似相同的时间点上收集的数据 描述现象在某一时刻的变化情况 比如,2006年我国国内生产总值数据 时间序列数据(time series data) 在不同时间上收集到的数据 描述现象随时间变化的情况 比如,1996年至2005年国内生产总值数据 考察 确定下列数据的类型 1.你的职业是什么? 2.你的收入是多少? 3.你获得的学位是什么? 4.你如何评价教育质量? 一、总体和样本 总体(population) 所研究的全部元素的集合 ,其中的每一个元素称为个体 分为有限总体和无限总体 有限总体的范围能够明确确定,且元素的数目是有限的 无限总体所包括的元素是无限的,不可数的 思考 1.研究工商学院17000学生的月平均消费,抽取了1000个学生做调查,得到的结果是月平均消费500元 2.某研究部门准备在全市200万个家庭中抽取2000个家庭,据此推断该城市所有家庭的年人均收入 抽取样本注意的问题 样本必须取自同一总体 样本个数的多少和样本量与抽样方法有关 样本的抽取必须保持客观性和代表性 样本会有误差 二、参数和统计量 参数(parameter) 用来描述总体特征的概括性数字度量 参数主要有总体均值(?)、标准差(?)、总体比例(?)等 总体参数通常用希腊字母表示 统计量(statistic) 用来描述样本特征的概括性数字度量 样本统计量有样本均值(?x)、样本标准差(s)、样本比例(p)等 样本统计量通常用小写英文字母来表示 思考 为了估计某城市拥有汽车的家庭比例,抽取500个家庭的一个样本,得到拥有汽车的家庭比例为35% 综合举例 一家研究机构从IT从业者中随机抽取了1000人作为样本进行调查。其中,60%的人回答他们的月收入在5000元以上,50%的人回答他们的消费支付方式是信用卡。 (1)这一研究的总体是什么? (2)月收入是什么类型的数据? (3)消费支付方式是什么类型的数据? (4)这一研究涉及截面数据还是时间序列数据? 三、变量(Variable)与指标(Indicator) (一)变量 说明样本数量特征的概念 如设备数量、安装率、完好率、利用率等 变量的具体表现称为变量值,20台、100%、98%、95%等即为变量值也称为数据 变量可以分为 分类变量(categorical variable)

文档评论(0)

yaocen + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档