统计学第六版期末考试考点梳理.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

记录学(第六版)期末考试考点梳理

导论

1。1。1什么是记录学

记录学是收集、解决、分析、解释数据并从数据中得出结论的科学。

数据分析所用的方法分为描述记录方法和推断记录方法。

1。2记录数据的类型

1。2。1分类数据、顺序数据、数值型数据

按照所采取的计算尺度不一样,可以将记录数据分为分类数据、顺序数据、数值型数据。

分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的成果,数据体现为类别,是用文字来表达。

例如:支付方式、性别、公司类型等。

顺序数据:只能归于某一有序类别的非数字型数据。

例如:员工对改革方法的态度、产品等级、受教育限度等。

数值型数据:按数字尺度测量的观测值,其成果体现为具体的数值.

例如:年龄、工资、产量等。

记录数据大致上可分为品质数据(定性数据)和数量数据(定量数据、数值型数据)。

1.2.2观测数据和实验数据

按照记录数据的收集方法,可以分为观测数据和实验数据。

观测数据:经过调查或观测而收集的数据。例如:降雨量、GDP、家庭收入等。

实验数据:在实验中控制实验对象而收集到的数据。例如:医药实验数据、化学实验数据等.

1。2.3截面数据和时间序列数据

按照被描述的现象与时间的关系,可分类截面数据和时间序列数据。

截面数据:在相同或近似相同的时间点上收集的数据。例如:我国各省市的GDP.

时间序列数据:同一现象在不一样的时间收集的数据。例如:—湖北省的GDP。

1。3.1总体和样本

总体:包含所研究的全部个体(数据)的集合。

样本:从总体中抽取的一部分元素的集合。

1.3.2参数和记录量

参数:用来描述总体特征的概括性数字度量。

记录量:用类描述样本特征的概括性数字度量。

例如:某研究机构准备从某乡镇5万个家庭中抽取1000个家庭用于推断该乡镇全部农村居民家庭的年人均纯收入。这项研究的总体是5万个家庭;样本是1000个家庭;参数是5万个家庭的人均纯收入;记录量是1000个家庭的人均纯收入。

数据的收集

2.1数据的起源

2.1。1数据的间接起源

间接起源的数据:假如与研究内容关于的原信息已经存在,我们只是对这些原信息重新加工、整理,使之成为我们进行记录分析可以使用的数据。

例如:记录公报、记录年鉴、某机构或某团队提供的数据、期刊、报纸和图书提供的数据、会议交流的数据、互联网查阅的数据等。

二手数据的优缺陷:

优点:收集以便,采集成本低,数据采集快,作用广泛等.

缺陷:针对性不够。

2。1。2数据的直接起源

普查:调查针对总体中的全部个体单位进行。

普查数据的优缺陷:

优点:调查范围广,被调查单位多,信息全方面,完整.

缺陷:调查费时,费劲,费钱.

2.2调查数据

2。2。1概率抽样和非概率抽样

反复抽样:从总体中抽取一个元素后,把这个元素放回到总体中再抽取第二个元素,直至抽取n个元素为止的抽样方法。

简朴随机抽样:从含有N个元素的总体中,抽取n个元素作为样本,使得总体中的每一个元素都有相同的概率被抽中的抽样方式。

分层抽样:在抽样时,将总体提成互不交叉的若干个层级,然后按一定的比例,从各层次独立地随机抽取一定数量的个体,将各层次取出的个体合在一起作为样本。

整群抽样:先将总体划分为若干群体,然后以群作为抽样单位从中抽取部分群,再对抽中的各个群中所包含的全部元素进行观测的抽样方式.

以便抽样:调查过程中由调查员依据以便原则,自行拟定入样单位。

滚雪球抽样:调查时一方面选择一组调查单位,对其实施调查后,再请他们提供此外某些属于研究总体的调查对象,调查人员依照所提供的线索,进行此后的调查的调查方式。

2.4.1抽样误差

样本量与抽样误差成反比。随着样本量的逐渐增大,抽样误差就越小。

2。4。3误差的控制

经过样本量的大小控制可以变化误差大小,规定的抽样误差越小,所需要的样本量就越大。

第三章数据的图表展示

3。2.1分类数据的整理与图示

(3)饼图

重要用于表达一个样本(或总体)中各构成部分的数据占全部数据的比例。适合于描述结构性问题.

(4)环形图

显示多个样本各部分所占的相应比例。适合于比较研究两个或多个样本或总体的结构性问题.

3。3。1数据分组

为解决数据分组不重的问题,记录分组时习惯上规定“上组限不在内”即当相邻两组的上下限重叠时,恰好等于某一组上限的变量值不算在本组内,而计算在下一组。(a≤x<b)

3.3.2数值型数据的图示

1.分组数据:直方图

用于展示分组数据分布的一个图形。

直方图与条形图区别:

条形图:条形长度表达频数;宽度固定不变;矩形分开排列;展示分类数据

直方图:面积表达频数;宽度表达组距;矩形连续排列;展示数值型数据

3.时间序列数据:线图

重要用于反映现象随时间变化的特征,描述其变化趋势。

4.多变量数据的图示

(1)散点图

文档评论(0)

159****1748 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档