- 1、本文档共21页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
(数据分析与预测复习资料
第一章1.1.1统计工作:是对所研究现象的数据资料进行搜集、整理、描述和分析的过程,目的是研究数据内在的数量规律性,进而认识所研究现象的本质。过程:统计设计、统计调查、统计整理和统计分析。?统计资料:也称统计信息,是反映一定社会经济现象总体或自然现象总体的特征或规律的数字资料、文字资料、图表资料及其他相关资料的总称。形式:统计表、统计图、统计年鉴、统计公报、统计报告和其他有关统计信息的载体。1.1.2 统计学:统计学是研究如何搜集资料、整理资料和分析资料的方法论科学。统计学研究对象具有数量性、总体性、具体性的特点。数量性:是统计学研究对象的基本特点总体性:是指统计学所研究的是总体的数量规律性,而不是个体的数量规律性。统计对总体的研究是从个体着手的。具体性:是指统计学所研究的是具体现象的数量规律性,是说明在一定时间、地点条件下的数量,是与一定的质相联系的数量,不是抽象的数量规律。1.3.1总体:具有某种相同性质的许多个别单位构成的集合称作统计总体,简称总体。构成总体的个别单位叫做总体单位。若干个单位所有的某种相同性质称为总体的“同质性”,这是形成统计总体的必要条件。总体:有限总体与无限总体。一个总体中包括的总体单位数是有限的,称为有限总体。若总体是由无穷多个总体单位构成的,称为无限总体。总体和总体单位为是可以互相转化的。样本:是从总体中抽取的部分单位所构成的集合,其中的每一个单位称作样本单位。样本具有这样几个特点:样本单位必须抽自总体内部,总体以外的单位不能参加样本的抽取;从一个总体中可以抽取多个样本;样本必须具有代表性;样本必须具有客观性。分类:方便样本、判断样本和随机样本。随机样本是按照随机原则从总体中抽取的样本,总体中每个单位都有同等的机会被抽中。三种不同的样本都可以作为总体的代表,但其中只有随机样本的抽样误差可以用概率的理论来描述,所以只有随机样本可以用于推断统计。1.3.2统计是研究总体的,但要从总体单位入手。统计研究就要从这些属性和特征入手。标志:总体单位的属性或特征称为标志,或者说标志是总体单位的名称,按性质不同可分为品质标志与数量标志。品质标志:是表明总体单位属性的特征,是不能用数量来衡量的。数量标志:是表明总体单位量的特征的,是可以用数量来衡量的。标志:在各单位的具体表现称为标志表现,简称标志值。又可分为可变标志和不可变标志。不可变标志就是所有总体单位同一标志的标志表现是相同的;可变标志是个总体单位同一标志的标志表现各不相同。总体单位的不可变标志正是构成总体的必要条件,即“同质性”。指标:统计指标是表明总体数量特征的,简称指标。任何一个统计指标都是由指标名称、所属时间、所属空间、指标数值、计量单位和计算方法等要素构成的。所有统计指标按其所反映的总体内容不同,可分为数量指标和质量指标。数量指标:是说明总体规模大小、数量多少的统计指标,是用绝对数形式来表现的。质量指标:是说明总体内部数量对比关系和总体单位水平的统计量指标,大多数是用相对数和平均数表现的。标志和指标既有区别又有联系。两者的联系主要表现在两方面:一是数值的汇总关系,即统计指标由总体单位的数量标志的标志值汇总而来;二是二者之间的转化关系,即统计指标与数量标志之间可以相互转化,这种转化与总体和总体单位之间的转化是联系在一起的。1.3.3参数:是用来描述总体特征的概括性数字度量,它是研究想要了解总体的某种特征值。通常有总体平均数、总体标准差、总体比例等。在统计中,总体参数通常用希腊字母表示。统计量:是用来描述样本特征的概括性数字度量。由样本数据计算得到,是样本的函数。主要有样本平均数、样本标准差、样本比例等。样本统计量通常用英文字母来表示。1.3.4变量:是说明现象某种特征的概念,其特点是从一次观察到下一次观察结果会呈现出差别或变化,统计数据就是统计变量的某些取值。变量可分为连续变量和离散变量。连续变量的数值是连续不断的,相邻两个值之间可以无限分割,可取无数个值。离散变量的数值都是可以用整数位断开的。1.4.1统计数据的类型:分类数据:是只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,是用文字来表述的。顺序数据:是只能归于某一有序类别的非数字型数据。顺序数据虽然也是类别,但这些类别是有序的。数值型数据:是按数字尺度测量的观察值。分类数据和顺序数据:说明的是事物的品质特征,通常是用文字来表述的,其结果均表现为类别,因而也可统称为定性数据或品质数据(Qualitative Data);数值型数据说明的是现象的数量特征,通常是用数值来表现的,因此也可称为定量数据或数量数据(Quantitative Data)。1.4.2按收集数据的方法分类:可以分为观测数据和实验数据观测数据是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的
文档评论(0)