统计学复习串讲(已更新)..docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
统计学复习串讲(已更新).

导论 参数:描述总体的特征,总体平均数μ,总体标准差σ 统计量:描述样本的特征,样本平均数,样本标准差SD 数据/变量的类型: 类别型(品质型)变量(分类的数据),如性别,男、女(男、女表示两种不同类别);数值型变量(数值型数据),如身高,170cm。 数据的搜集 数据搜集方法:①二手数据:网络、年鉴、报纸、白皮书、研究报告、咨询机构的调研报告;②一手数据:观察、访谈、问卷调查(自填式、面访式、电话式)、实验。 收集一手数据时,由于人力物力财力的限制,很难穷尽所有的研究对象(普查),只能抽取量一定的研究对象,构成样本。借助样本的信息,推断总体的状况。但样本毕竟不等于总体,两者的差别称为抽样误差。增加样本的容量以及采用不同的抽样方法能一定程度降低误差,但误差不能根除。按照抽样过程是否受主观的因素的影响,分为概率抽样(客观抽样)和非概率抽样(主观抽样)。概率抽样具体分为:①简单随机抽样;②分层抽样;③系统抽样(等距随机抽样);④整群抽样(抽样以群体为单位,如华软学院被抽中了,则全院的教师和学生都成为样本);⑤多阶段抽样(每阶段随机抽取样本既可以是以个体为单位,又可以是以群体为单位)。概率抽样的实施必须找到清晰的抽样框,也就是研究对象的总体界限必须明确,实际中大部分研究的对象包含哪些并不明确,转而采用非概率抽样。非概率抽样具体分为:①方便抽样;②配额抽样;③判断抽样;④自愿样本;⑤滚雪球抽样。非概率抽样的耗时短,成本低,无需确定抽样框,但是样本质量不高,不能有效推断总体的状况,只能起到了解总体概况的作用。 数据的误差:两类型的来源——抽样误差与非抽样误差。采用概率抽样的方法能减少抽样误差。非抽样误差包括:抽样框误差、回答误差、无回答误差、调查员误差、测量误差。 数据的图表展示 频数:条形图(每组频数的统计可以借助Excel的数据透视表模块实现) 比例:饼图 变化趋势:折线图 X与Y的关系:散点图 数据的分布状况:直方图,先将数值型数据排序,然后分组(组中距和组数),画条形,条形之间没有间隔,勾画出该组数据的全貌。 数据的概括性度量 (一)集中趋势 众数:频数最多的组对应的指标值 中位数:处于中间位置的数据。步骤①排序;②定位(50%位置);③抽取数值。 平均数:数据质量高,但易受极端值的影响。类型①简单平均数;②加权平均数(结合例题P95习题4.5);③几何平均数(平均增长率、平均盈利率)。 (二)离散趋势指标 异众比率:非众数对应的频数除以总频数 极差(全距):最大值-最小值 四分位差:3rd四分位数-1st四分位数 平均差:(mean deviation)每一数据与平均数的差的绝对值,再求和,最后求平均数(用得比较少)。 方差: ,记得一般提供的是样本数据,分母是n-1,到了后面的章节n-1称为自由度。总体数据的话,。 标准差:方差的开方,由于标准差与原始数据同一个等级,带单位。 标准差系数(离散系数):用于比较多组数据离散(波动)程度的差异。由于离散系数能克服各组数据单位的差别以及平均值的差异,所得结论更为精确。。 (三)数据分布指标:偏态和峰态 偏态系数SK,SK0右偏,SK0左偏,SK=0无偏。SK1,严重右偏;SK-1,严重左偏。这里要注意绘图,如右偏,长尾巴在右,高峰在左,则众数中位数平均数。 峰态系数0,则分布形状又高又窄;峰态系数0,则分布形状又矮又宽。 指数 指数反映的是某指标随时间推移的变化。经济管理中,生产者关注销售量变化,消费者关注价格变化,因此,常见的指数包括销售量指数和价格指数。实际情况下,要合并几种不同种类产品的价格或销售量,但每种产品的价格、销售量的单位都不相同,需要借助销售额的形式进行合并,所求指数称“加权综合指数”。加权综合指数的计算步骤为“先综合(求和,∑pq),后对比(作差或作商;作差称为绝对指数,带单位;作商称为相对指数,不带单位)”。 加权综合指数中,为了分离价格的变化,研究者需要将销售量固定在相同的时期(此时销售量称为同度量因素)。如果选择固定在基期(q0),该加权综合指数称为拉氏指数;如果选择固定在报告期(q1),该加权综合指数称为帕(派)氏指数。分离销售量的变化时,则将价格固定即可。 对于指数的因素分析过程, p0q0变为p1q1,研究者规定,先量变(销售量的影响,p0q0变为p0q1),后质变(价格的影响,p0q1变为p1q1)。 抽样分布 研究者用概率抽样的方法获得代表性高的样本,重复N次抽样后获得N个样本,每个样本包含n个元素(n称为样本容量)计算出,这些构成的分布称为“抽样分布”。 抽样分布的形状根据以下规则判断:①总体分布为正态,则抽样分布为正态分布;②总体分布状况为偏态或未知,如果样本容量n30,则抽样分布趋近于正态分布(此定理称“中心极限定理”

文档评论(0)

vc5gv1x + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档