统计学复习串讲(已更新)解答.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
导论 参数:描述总体的特征,总体平均数 卩,总体标准差(7 统计量:描述样本的特征,样本平均数 X,样本标准差SD 数据/变量的类型: 统计数据的分类 按计量层次 按收集方法 按时间状况 类别型(品质型)变量(分类的数据) ,如性别,男、女(男、女表示两种不同类别) 数值型变量(数值型数据),如身高,170cm。 数据的搜集 数据搜集方法:①二手数据:网络、年鉴、报纸、白皮书、研究报告、咨询机构的调研 报告;②一手数据:观察、访谈、问卷调查(自填式、面访式、电话式) 、实验。 收集一手数据时,由于人力物力财力的限制,很难穷尽所有的研究对象(普查) ,只能 抽取量一定的研究对象, 构成样本。借助样本的信息,推断总体的状况。但样本毕竟不等于 总体,两者的差别称为抽样误差。增加样本的容量以及采用不同的抽样方法能一定程度降低 误差,但误差不能根除。按照抽样过程是否受主观的因素的影响, 分为概率抽样(客观抽样) 转而采用非概率抽样。非概率抽样和非概率抽样(主观抽样)。概率抽样具体分为:①简单随机抽样;②分层抽样;③系统抽 样(等距随机抽样);④整群抽样(抽样以群体为单位,如华软学院被抽中了,则全院的教 师和学生都成为样本);⑤多阶段抽样(每阶段随机抽取样本既可以是以个体为单位,又可 以是以群体为单位)。概率抽样的实施必须找到清晰的抽样框,也就是研究对象的总体界限 必须明确,实际中大部分研究的对象包含哪些并不明确, 具体分为:①方便抽样;②配额抽样;③判断抽样;④自愿样本;⑤滚雪球抽样。非概率抽 样的耗时短,成本低,无需确定抽样框,但是样本质量不高,不能有效推断总体的状况,只 能起到了解总体概况的作用。 转而采用非概率抽样。非概率抽样 数据的误差:两类型的来源一一抽样误差与非抽样误差。 采用概率抽样的方法能减少抽 样误差。非抽样误差包括:抽样框误差、回答误差、无回答误差、调查员误差、测量误差。 数据的图表展示 频数:条形图(每组频数的统计可以借助 Excel的数据透视表模块实现) 比例:饼图 变化趋势:折线图 X与Y的关系:散点图 数据的分布状况:直方图,先将数值型数据排序,然后分组(组中距和组数) ,画条形, 条形之间没有间隔,勾画出该组数据的全貌。 数据的概括性度量 (一) 集中趋势 众数:频数最多的组对应的指标值 中位数:处于中间位置的数据。步骤①排序;②定位( 50%位置);③抽取数值。 平均数:数据质量高,但易受极端值的影响。类型①简单平均数;②加权平均数(结合 例题P95习题4.5);③几何平均数(平均增长率、平均盈利率) 。 (二) 离散趋势指标 异众比率:非众数对应的频数除以总频数 极差(全距):最大值-最小值 四分位差:3rd四分位数-1st四分位数 平均差:(mean deviation)每一数据与平均数的差的绝对值, 再求和,最后求平均数(用 n 送飢-X 得比较少)。M d =亠 n n2送(Xi -X)方差: n 2 送(Xi -X) 方差: SD2二第 ,记得一般提供的是样本数据,分母是 n-i,到了后面的 n —i n 2 章节n-1称为自由度。总体数据的话,■:「2=亠 n 标准差:方差的开方,由于标准差与原始数据同一个等级,带单位。 由于离散系数能克服各组数据单位的差别以及平均值的差异,所得结论更为精确。VsSD 由于离散系数 能克服各组数据单位的差别以及平均值的差异,所得结论更为精确。 Vs SD ~ 。 X (三)数据分布指标:偏态和峰态 严重右偏;SK-1,严重中位数 平均数。偏态系数 SK,SK0右偏,SK0 严重右偏;SK-1,严重 中位数 平均数。 左偏。这里要注意绘图,如右偏,长尾巴在右,高峰在左,则众数 峰态系数0,则分布形状又高又窄;峰态系数 0,则分布形状又矮又宽。 指数 指数反映的是某指标随时间推移的变化。 经济管理中,生产者关注销售量变化,消费者 关注价格变化,因此,常见的指数包括销售量指数和价格指数。实际情况下,要合并几种不 同种类产品的价格或销售量, 但每种产品的价格、 销售量的单位都不相同, 需要借助销售额 的形式进行合并,所求指数称“加权综合指数” 。加权综合指数的计算步骤为“先综合(求 和,刀pq),后对比(作差或作商;作差称为绝对指数,带单位;作商称为相对指数,不带 单位)”。 加权综合指数中,为了分离价格的变化, 研究者需要将销售量固定在相同的时期 (此时 销售量称为同度量因素)。如果选择固定在基期(qo),该加权综合指数称为拉氏指数;如果 选择固定在报告期(qi),该加权综合指数称为帕(派)氏指数。分离销售量的变化时,则 将价格固定即可。 对于指数的因素分析过程, Poqo变为Piqi,研究者规定,先量变(销售量的影响, Poqo 变为Poqi),后质变(价格

文档评论(0)

136****3783 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档