数据分析建模复习要点..docxVIP

  1. 1、本文档共22页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据分析建模复习要点.

第一章统计学的研究对象和性质统计学是一门收集、整理和分析数据的方法科学,其目的是探索数据的内在数量规律性,以达到对客观事物的科学认识统计学由一套收集和处理统计数据的方法组成,这些方法来源于对统计数据的研究,目的也在于对统计数据研究;统计数据不用统计方法去分析,则仅仅是一组数据,无法得到任何有益的结论。一、统计学的要素和内容1统计总体与总体单位凡客观存在的,在某些相同性质基础上综合起来的许多个别事物的全体,称为统计总体,简称总体。组成总体的个体,称为总体单位或样本。例1:全国或某地区全部工业企业可构成一(统计)总体(每个企业都从事工业生产经营活动,经济职能相同,具有同质性)。每个工业企业即为总体单位。同质性是构成统计总体的基础。总体单位的总个数,称为总体单位数或样本数(常用N表示)。根据总体中包含的单位数的范围可将统计总体分为有限总体(总体中包含的单位数是有限的)和无限总体(指总体数无限或总体范围无法确定)。进行抽样调查或研究时,抽取的部分单位组成的总体又称为样本总体,也简称为样本。样本都是有限总体,其单位数(也称为样本容量)常用n表示。注意:总体与总体单位不是固定不变的,它们可根据研究的目的与任务的不同,以及条件的变化,其地位或位置是可以变换的。2标志与指标标志:标志是说明总体单位某种特征的名称(variable)。例3:某工业企业全体职工形成的总体,每个职工这一总体单位都有性别、文化程度、年龄、身高、体重等不同的标志;某地区所有工业企业组成的总体中,每个企业这一总体单位都有所有制形式、职工人数、生产总值等不同标志。标志按其所反映的特征性质的不同,可分为品质标志与数量标志。品质标志:表明事物的质或属性,这一特征无法用数值表示。(上述例中职工的性别、文程度;企业的所有制形式;股票例中的股票交易所)数量标志:表明事物的量或值。(如职工的年龄、企业的产值、股票年销售量)注:品质标志值可以是数字,但却不具数值的含义,因此不能对其进行算术运算,或其算术运算无意义(如某地的车牌号,电话号码等)标志的具体表现为标志值。指标统计指标:统计指标是说明总体特征的范畴或名称。它反映某事物现象总体的质的规定性与量的确定性。指标的具体表现称为指标的数值。统计指标,一般包括5个部分,即:指标的名称、(统计的)时间、范围(空间)、指标数值及相应的计量单位。统计指标的种类根据指标反映内容的不同,可以分为数量指标和质量指标按其表现形式分为总量指标、相对指标和平均指标指标与标志的区别与联系区别:指标是说明总体特征的,标志则说明总体单位特征;统计指标都是用数量表示的,而统计标志则不尽然。联系有许多统计指标的数值是从总体单位的数量标志值汇总而来。如:某省粮食总产量是从该省各地区粮食总产量汇总而来;某工业行业增加值是由该行业所有企业增加值汇总而来。指标与数量标志之间存在变换关系。由于研究目的不同,当原来的统计总体变成总体单位时,相应的统计指标也就变成数量标志了,反之亦然。如:某地区某工业行业增加值是研究该地区该工业行业总体时的统计指标;而又是研究该地区全部工业增加值的一个数量标志。统计指标体系3变异与变量统计中的标志和指标都是可变的,即标志和指标的具体表现可不相同,这种差别称为变异,有属性的变异和数值的变异。具有变异的标志也叫可变标志。用数量表示的可变标志和指标也叫变量。变异是普遍存在的,这是统计的前提,有变异才有统计存在的必要。变量例5:研究某地区工业企业,每个工业企业拥有的固定资产可能不同,则工业企业的固定资产就是一个可变标志,也是一个变量。而该地区所有工业企业的固定资产总和则为一指标,它随时间(年)而变化,也是一变量。\变量按其值是否连续出现,可分为连续变量与离散变量。离散变量的变量值只能取整数,且只能通过计数的方法取得(人数、企业数、机器台数等)连续变量的变量值是连续的,相邻两个值之间可以取任意数值。(人的身高、体重,工厂的产值等)变量按其性质的不同,可分为确定性变量与随机性变量。确定性变量,指其变化方向及其结果变量值可以确定;如:圆的面积,一旦半径确定下来,则面积就可唯一确定随机性变量,指其取值不确定,有一定的偶然性。如:粮食产量与施肥量的关系,施肥量确定,但粮食产量不一定就能确定下来4.样本样本:是从总体中随机抽取部分单位所构成的集合体。样本特点:必须取自所要研究的总体;从一个总体中可抽取许多个样本,这些样本的数值是不同的,也即存在着随机的差异;样本必须具有代表性;样本必须具有客观性,也即排除主观因素的影响推断:就是以样本信息为依据对总体的某些特征作出预测和估计。推断的可靠性:根据随机抽取的样本对总体推断所得出的结果的可靠程度,也称置信度。统计数据的测量尺度一般分为4类:定类尺度、定序尺度、定距尺度、和定比尺度等四个测定层次的比较二.描述统计学与推断统计描

文档评论(0)

stzs + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档