- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
.
第 1章 统计和统计数据
1 统计学的定义:是收集、处理、分析、解释数据并从数据中得出结论的科学
描述统计与推断统计的含义、容、目的。
描述统计 :是研究数据收集 ,处理和描述的统计学方法 .其容包括如何取得研究所需要的数据,如何用图表形式
对数据进行处理和展示 ,如何通过对数据的综合,概括与分析 ,得出所关心的数据特征 .
推断统计 :是研究如何利用样本数据来推断总体特征的统计学方法 ,容包括两大类 :
参数估计:是利用样本信息推断所关心的总体特征 .
假设体验 :是利用样本信息判断对总体的某个假设是否成立 .
2 、变量与数据:不同数据类型的含义,会判断已有数据的类型.
变量 :它们的特点是从一次观察到下一次观察会出现不同结果.
Ex: 企业销售额, 上涨股票的家数, 生活费支出,投掷一枚骰子观察其出现的点数
数据:把观察到的结果记录下来 .
总体 : 包含所研究的全部个体 (数据的集合)
样本: 从总体中抽取的一部分元素的集合
样本量: 构成样本的元素的数目
定量变量或数值变量: 定量变量的观察结果称为定量数据或数值型数据.可以用阿拉伯数据来记录其观察结
果 .如“企业销售额”、“上涨股票的家数”、“生活费支出”、“投掷一枚骰子出现的点数”
定性变量: 分类变量和顺序变量统称为定性变量
分类变量: 表现为不同的类别.如“性别”、“企业所属的行业”、“学生所在的学院” 等.
分类变量的观察结果就是分类数据
顺序变量或有序分类变量 : 具有一定顺序的类别变量. 如考试成绩按等级,一个人对事物
的态度 .顺序变量的观察结果就是顺序数据或有序分类数据
离散型变量:只能取有限个值得随机变量
连续型变量 :可以取一个或多个区间中任何值得随机变量
3 、获得数据的概率抽样方法有哪些?
根据一个已知的概率来抽取样本单位,也称随机抽样
-简单随机抽样 : 从总体N 个单位(元素中随机地抽取) n 个单位作为样本,使得总体中每一个元素都有相同
的机会 (概率 )被抽中 . 抽取元素的具体方法有重复抽样是抽取一个个体记录下数据后,再把这个个体放回到
原来的总体中参加下一次抽选。不重复抽样抽中的个体不再放回,再从所剩下的个体中抽取第二个元素,直
到抽取 n 个个为止。
- 分层抽样或分类抽样 :它是在抽样之前先将总体的元素划分为若干层(类),然后从各个层中抽取一定数
量的元素组成一个样本。
.
.
-系统抽样或等距抽样:它是想将总体个元素按某个顺序排列,并按某种规则确定一个随机起点,然后,每隔
一定的间隔抽取一个元素,直至抽取n 个元素组成一个样本。
整群抽样- :是先将总体划分成若干群,然后以群作为抽样单元从中抽取部分群组成一个样本,再对抽中的每
个群中包含的所有元素进行观察。
第二章 .用图表展示数据
频数 :落在各类别中的数据个数
比例:某一类别数据个数占全部数据个数的比值
百分比 : 将对比的基数作为 100 而计算的比值
比率: 不同类别数值个数的比值
频数分布表 : 频数分布表中落在某一特定类别数据.频数分布包含了很多有用的信息,通过它可以观察不同类
型数据的分布状况 .
什么是条形图 :是用宽度相同的条形来表示数据多少的图形用于观察不同类别数据的多少或分布状况 .
帕累托图 :是按各类别数据出现的频数多少排序后绘制的条形图
饼图 :是用圆形及圆扇形的角度来表示数值大小的图形 ,它主要用于表示一个样本或总体( 中各组成部分道德)
数据占全部数据的比例对于研究结构性问题十分有用, .
环形图:只能显示一个样本各部分所占的比例
数据分组:是根据统计研究的需要 ,将原始数据按照某种标准化分成不同的组别.
1. 下限 (lower limit) :一个组的最小值
2. 上限(upper limit) :一个组的最大值
3. 组距(class width) :上限与下限之差
4. 组中值(class midpoint) :下限与上限之间的中点值
文档评论(0)