- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
导论
参数:描述总体的特征,总体平均数 卩,总体标准差(7
统计量:描述样本的特征,样本平均数 X,样本标准差SD
数据/变量的类型:
统计数据的分类
按计量层次
按收集方法
按时间状况
类别型(品质型)变量(分类的数据) ,如性别,男、女(男、女表示两种不同类别)
数值型变量(数值型数据),如身高,170cm。
数据的搜集
数据搜集方法:①二手数据:网络、年鉴、报纸、白皮书、研究报告、咨询机构的调研 报告;②一手数据:观察、访谈、问卷调查(自填式、面访式、电话式) 、实验。
收集一手数据时,由于人力物力财力的限制,很难穷尽所有的研究对象(普查) ,只能
抽取量一定的研究对象, 构成样本。借助样本的信息,推断总体的状况。但样本毕竟不等于 总体,两者的差别称为抽样误差。增加样本的容量以及采用不同的抽样方法能一定程度降低 误差,但误差不能根除。按照抽样过程是否受主观的因素的影响, 分为概率抽样(客观抽样)
转而采用非概率抽样。非概率抽样和非概率抽样(主观抽样)。概率抽样具体分为:①简单随机抽样;②分层抽样;③系统抽 样(等距随机抽样);④整群抽样(抽样以群体为单位,如华软学院被抽中了,则全院的教 师和学生都成为样本);⑤多阶段抽样(每阶段随机抽取样本既可以是以个体为单位,又可 以是以群体为单位)。概率抽样的实施必须找到清晰的抽样框,也就是研究对象的总体界限 必须明确,实际中大部分研究的对象包含哪些并不明确, 具体分为:①方便抽样;②配额抽样;③判断抽样;④自愿样本;⑤滚雪球抽样。非概率抽 样的耗时短,成本低,无需确定抽样框,但是样本质量不高,不能有效推断总体的状况,只 能起到了解总体概况的作用。
转而采用非概率抽样。非概率抽样
数据的误差:两类型的来源一一抽样误差与非抽样误差。 采用概率抽样的方法能减少抽
样误差。非抽样误差包括:抽样框误差、回答误差、无回答误差、调查员误差、测量误差。
数据的图表展示
频数:条形图(每组频数的统计可以借助 Excel的数据透视表模块实现)
比例:饼图
变化趋势:折线图
X与Y的关系:散点图
数据的分布状况:直方图,先将数值型数据排序,然后分组(组中距和组数) ,画条形,
条形之间没有间隔,勾画出该组数据的全貌。
数据的概括性度量
(一) 集中趋势
众数:频数最多的组对应的指标值
中位数:处于中间位置的数据。步骤①排序;②定位( 50%位置);③抽取数值。
平均数:数据质量高,但易受极端值的影响。类型①简单平均数;②加权平均数(结合 例题P95习题4.5);③几何平均数(平均增长率、平均盈利率) 。
(二) 离散趋势指标
异众比率:非众数对应的频数除以总频数
极差(全距):最大值-最小值
四分位差:3rd四分位数-1st四分位数
平均差:(mean deviation)每一数据与平均数的差的绝对值, 再求和,最后求平均数(用
n
送飢-X
得比较少)。M d =亠
n
n2送(Xi -X)方差:
n
2
送(Xi -X)
方差:
SD2二第 ,记得一般提供的是样本数据,分母是 n-i,到了后面的
n —i
n
2
章节n-1称为自由度。总体数据的话,■:「2=亠
n
标准差:方差的开方,由于标准差与原始数据同一个等级,带单位。
由于离散系数能克服各组数据单位的差别以及平均值的差异,所得结论更为精确。VsSD
由于离散系数
能克服各组数据单位的差别以及平均值的差异,所得结论更为精确。
Vs
SD
~ 。
X
(三)数据分布指标:偏态和峰态
严重右偏;SK-1,严重中位数 平均数。偏态系数 SK,SK0右偏,SK0
严重右偏;SK-1,严重
中位数 平均数。
左偏。这里要注意绘图,如右偏,长尾巴在右,高峰在左,则众数
峰态系数0,则分布形状又高又窄;峰态系数 0,则分布形状又矮又宽。
指数
指数反映的是某指标随时间推移的变化。 经济管理中,生产者关注销售量变化,消费者
关注价格变化,因此,常见的指数包括销售量指数和价格指数。实际情况下,要合并几种不 同种类产品的价格或销售量, 但每种产品的价格、 销售量的单位都不相同, 需要借助销售额
的形式进行合并,所求指数称“加权综合指数” 。加权综合指数的计算步骤为“先综合(求
和,刀pq),后对比(作差或作商;作差称为绝对指数,带单位;作商称为相对指数,不带 单位)”。
加权综合指数中,为了分离价格的变化, 研究者需要将销售量固定在相同的时期 (此时
销售量称为同度量因素)。如果选择固定在基期(qo),该加权综合指数称为拉氏指数;如果 选择固定在报告期(qi),该加权综合指数称为帕(派)氏指数。分离销售量的变化时,则 将价格固定即可。
对于指数的因素分析过程, Poqo变为Piqi,研究者规定,先量变(销售量的影响, Poqo
变为Poqi),后质变(价格
原创力文档


文档评论(0)