- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
章知识点梳理
1-4 章知识点梳理
说明:复习题请以教材课后习题及教材配套《学习指导》中的习题为准。本笔记涉及的
知识点均为平时上课已强调的需掌握的知识点,借此做一总结梳理。同学们应结合教材及
PPT 进行回顾,同时应学会熟练运用这些数据分析方法。
◆理解统计学两大统计方法的概念并学会区分描述统计(数据的搜集、整理、图表展示、
数据分布特征描述)和推断统计 (利用样本数据推测总体)
◆掌握数据的分类并学会判断数据类型按计量尺度分、按时间分、按搜集方法分。
◆掌握统计几个重要的基本概念并学会运用总体和样本、参数和统计量、变量和变量值
例如:研究人员希望估计某大学30000 名在校本科生的平均月生活费支出。为此,他调
查了300 名学生,发现他们每月平均生活费支出是500 元。该研究人员感兴趣的参数为 ;
统计量为 ;变量“月生活费支出”为什么类型的变量? ;
A 、该大学的所有学生人数 B、该校所有本科生的月平均生活费支出
C、该大学所有30000 本科生的月生活费支出 D、所调查的300 名学生的月平均生活费支
出
解:参数C ;统计量D;注意:参数对应的是总体(该大学所有的30000 名在校本科生)
的数量特征指标;统计量对应的是样本 (抽取的300 名学生)的数量特征指标。
变量按其取值(变量值)的不同,可分为分类变量、顺序变量、数值型变量。其中,数
值型变量按取值是否可列,进一步分为离散型变量和连续型变量。因此,本题中“月生活费
支出”体现为金额,属于数值型变量,且其无法一一罗列,因此为数值型变量中的连续型变
量。
◆掌握概率抽样和非概率抽样的区别
◆学会不同概率抽样方法 (简单随机、分层、整群、系统、多阶段)概念及特点
◆学会不同非概率抽样方法(方便抽样、判断抽样(重点抽样是什么?和典型抽样是什么?)、
自愿样本、滚雪球、配额抽样(注意与分层抽样的相同点是什么?区别是什么?))概念及
特点
◆掌握抽样误差和非抽样误差的区别
误差:调查数据的值与总体真实值之间的差异。
抽样误差:由样本的随机性(按随机原则抽样)产生的。因此,只存在与概率抽样中。
误差可控制(可通过改变样本量大小控制),但不可避免,只要有随机抽样,即概率抽样,
就一定会产生这一误差。
非抽样误差:除抽样误差以外的所有误差。因此包含人为因素产生的误差(比如回答错
误、调查员错误等)。因此非抽样误差,只要是调查(全面调查、抽样调查)都可能产生。
理论上可以避免,但实际中很难控制。
◆掌握频数、频数分布、比例、比率的概念。
◆掌握品质数据(即定性数据,包含分类数据和顺序数据)和数值型数据(即定量数据)
的整理方法
品质数据按类别做分类整理,可制作频数分布表
数值型数据做分组整理。例如成绩可分为60 分以下,60-70,70-80,80-90,90 以上;连续
组距分组,要注意“上组限不在内原则”,比如考70 分的同学应该归在哪个组呢?应该归在
其作为下限的那个组里,即归在70-80 的组里。
另外注意组中值的计算方法、组中值的前提假定条件是?
◆掌握品质数据和数值型数据的图示(有哪些图?这些图的适用范围是什么?)
分类数据图示:条形图 (按类别,用条形的长度或高度表示频数大小)、帕累托图 (按
频数大小排序的条形图)、饼图 (最适合用于分析一个总体的内部结构问题)、环形图(适合
用于比较多个总体的内部结构问题)
顺序数据图示:累积频数分布图(向上累积、向下累积)、条形图、饼图、环形图
数值型数据图示:直方图(适用于分组数据,直方图与条形图的区别有哪些?)、茎叶
图(适用于原始数据,即未分组数据。茎叶图与直方图的区别有哪些?)、箱线图(适用于
原始数据)、散点图(适用于研究两个变量间相关关系)、气泡图(三个变量相关关系)、折
线图(用于反映时间序列数据的趋势)、雷达图(用于多变量的研究。也可以比较两组数据
的相似性)
◆掌握集中趋势度量指标
什么是集中趋势? (集中趋势就是数据向中心聚集的程度,这种趋势的衡量,往往要找
到数据的某种中心值或一般水平值,也就是说数据在这个中心值或平均值附近聚集)
测度集中趋势的指标有哪些?含义、如何计算?如何应用?(分不同数据类型适用不同
的测度值)分类数据-用众数
文档评论(0)