- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
统计学复习相关资料
第一章
统计学的概念
统计学是一门收集、整理、显示和分析统计数据的科学,其目的是探索数据内在的数量规律性。
统计学的分类:描述统计和推断统计
描述统计:是用图形、表格和概括性的数字对数据进行描述的统计方法。
推断统计:是根据样本信息对总体进行估计、假设检验、预测或其他推断的统计方法。
统计数据误差的分类:非抽样误差和抽样误差
非抽样误差:是由于调查过程中各有关环节工作失误造成的。是可以避免的
抽样误差:是利用样本推断总体时产生的误差。是不可避免的,但可以计量和控制。
4.①总体:所研究的全部个体(数据) 的集合,是唯一的,确定的,其中的每一个个体也称为元素(总体单位)。总体容量N
分为有限总体和无限总体
②样本:从总体中抽取的一部分元素的集合
构成样本的元素的数目称为样本容量或样本量n
③变量:是总体中个体单位所具有的特征或特性
变量的具体表现称为变量值,即数据
④变量可以分为
分类变量(categorical variable) :说明事物类别的名称.如性别(男,女)特点:只能用文字表示,无大小,平行排列
顺序变量(rank variable):说明事物有序类别的名称。如产品等级。特点:只能用文字表示,有大小,可排序
数值型变量(metric variable) :说明事物数字特征的名称。如:成绩、年龄、产量。特点:可用数字表示。
分类变量和顺序变量属于定性变量
数值型变量属于定量变量
第二章
5.①统计数据的分组:是将预处理过的数据按照某种特征或标准分成不同的组别。
分组的作用:突出了组间差异,而掩盖了组内差异
② 按定性指标分组-------品质标志分组
按定量指标分组-------数量标志分组
③数量标志分组--编制次数分布表
单变量值分组:指每个组值只用一个具体的变量值表现的数列
编制条件:变量是离散变量,变量的不同取值个数较少。同时具备
组距分组:指每个组的变量值用一个区间来表现
编制条件:变量是连续变量;
或:总体单位数较多,变量不同取值个数也较多的离散变量。
等距分组:变量值变动区间的长度相等
异距分组:变量值变动区间的长度不完全相等
2.组限:指每组两端表示各组界限的变量值,各组的最小值为下限,最大值为上限
注意:对于离散变量,相邻组组限可以间断,也可重叠;
对于连续变量,相邻组组限必须重叠
组距:每组变量值变动区间的长度,为上下限之差
组中值:每组变量取值范围的中点数值
图形图 ①条形图-----用于显示分类变量和顺序变量的次数分布
②饼图--------用于显示内部结构
③直方图-----用于显示数值型变量的次数分布
④茎叶图-----用于显示数值型变量的次数分布及具体构成
①众数:指总体中出现次数最多的变量值,用 表示,它不受极端数值的影响,用来说明总体中大多数单位所达到的一般水平。
组距分组众数的确定:
L表示众数所在组的下组限,表示众数组次数与前一组次数之差,表示众数组次数与后一组次数之差, i表示众数组的组距
②中位数:将总体各单位标志值按大小顺序排列后,处于数列中间位置的标志值,用 表示。它不受极端数值的影响,在总体标志值差异很大时,具有较强的代表性。
未分组的数据
组距分组数据
L表示中位数所在组的下组限,表示中位数所在组一下各组的累积次数,表示中位数所在组的次数,i表示中位数所在组的组距。
中位数的数学性质:各变量值与中位数的离差绝对值之和最小,即
应用:主要用于定序数据,也可用数值型数据,但不能用于定类数据
5.均值的计算(前提:数据呈对称分布)
①算术平均数
未分组的数据
:
加权均值------数据已分组
--------决定平均数的变动范围
-------起到权衡轻重的作用
②调和平均数:调和平均数,是各数据倒数的(简单)算术平均数的倒数
加权调和平均数
=乘以
注意:平均数=标志总量/单位数
如果知道分子,用加权调和平均数;如果知道分母,用加权算术平均数
③几何平均数:是N项变量值连乘积的开N次方根
应用:用于计算现象的平均比率或平均速度
应用的前提条件:各个比率或速度的连乘积等于总比率或总速度;
相乘的各个比率或速度不为零或负值
④切尾均值:去掉大小两端的若干数值后计算中间数据的均值
⑤中位数、众数、均值三者的关系
离散程度
①极差:指所研究的数据中,最大值与最小值之差(一般应用于对称、单峰、大样本)
优点:计算方法简单、易懂;
缺点:1、极差易受极端值的影响;
2、由于极差只利用了数据两端的信息,没有反映中间数据
您可能关注的文档
最近下载
- 淘宝店铺运营方案ppt.pptx VIP
- 大学英语四级写作ppt课件-课程.ppt VIP
- 【人教七年级上册数学情境课堂课件】 3.1.3 反比例关系 课件.pptx VIP
- 2025-2026部编人教版三年级语文上册(全册)测试卷(附答案).pdf VIP
- 骨质疏松健康宣教ppt(完整版).pptx VIP
- 陕2022TJ067厨卫装配式钢丝网混凝土排气道系统建筑构造图集.docx VIP
- 八大危险作业票八大危险作业票.doc VIP
- DB53T684.10-2015 昭通乌天麻 第10部分:初加工技术规程.pdf VIP
- (含答案)福建省宁德市福鼎县2019-2020学年八年级上学期期中物理试题(质量检测).pdf VIP
- 什么叫电击和电伤.pptx
文档评论(0)