[经管营销]描述性统计分析.ppt

  1. 1、本文档共45页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[经管营销]描述性统计分析

描述性统计分析 统计分析的基本概念 进行数据分析首先应: 明确分析的目的 明确分析的对象 确定是否需要抽样 在一些问题中,要考查整个总体往往是不可能的,因为要耗费太多的时间和资源 确定需要记录的数据项目 1. 总体和样本 总体(population)是所研究的指标测量值的集合。 抽样方法 简单随机抽样:在抽样的过程中,任何一个样本被选中的机会都相同。 利用计算机产生的随机数(对于有限总体),可模拟简单随机抽样,如对学生的学号用随机数进行抽样 对于无限总体不能进行标号,抽样过程不能用随机数,难于实施 分层抽样:按数据的层次进行抽样。 如小学生的身高,按每年级分为一个层 分层抽样的优点 抽取的样本在总体中分布得更均匀,更合理 个层内单位之间差异程度相对减小,使在该层内抽取的样本对该层的代表性得到提高 层内成员差异小,而层间成员差异较大时,分层抽样可以提高估计的精度 2. 参数和统计量 对总体概括度量值和对样本概括度量值所用的方法及名称是不同的。 总体的度量值称为参数(parameters),样本的度量值称为统计量(statistics)。 通常,总体参数是未知的,SAS系统给出的描述统计量适用于样本。 2. 参数和统计量 参数(parameters):总体的度量值。 统计量(statistics):样本的度量值。 一般总体参数用希腊字母表示: 均值 方差 标准差 总体 μ σ2 σ 样本 X s2 s 3. 自由度 自由度是某一统计量中,变量可以自由取值的个数 用df表示自由度。 [例]变量X有n个取值, df=n;若它们受到k(kn)个条件制约,则df=n-k 4. 表示数据位置的统计量 均值(Mean): 所有观测值的平均值。 4. 表示数据位置的统计量 众数(Mode):观测值中出现最多的数。 百分位数(Percentile): 描述数据分布和位置的统计量。 0.5分位数就是中位数,0.75分位数和0.25分位数分别称为上、下四分位数,记为Q3和Q1。 一般地,k百分位数(k-percentile),即约有k%的观测值小于它。 5. 表示数据分散程度的统计量 极差(Range):数据中最大值和最小值之差。 [例]SAS计算样本方差的步骤 计算样本均值 计算每个观测值同均值的差值 把这些差值分别平方再求这些平方的和 把平方和除以n-1,n为差值的个数(样本容量)假设样本值分别为10,11,12,15,均值为12,样本容量为4,方差按下式计算: s2=((10-12)2+(12-12) 2+(11-12) 2+(15-12) 2)/(4-1)=4.67 5. 表示数据分散程度的统计量 标准差(Standard deviation或Std Dev):方差的开平方。 标准差的量纲与原变量一致。 方差和标准差所反映的是数据对其均值的某种离散程度。标准差(或方差)较小的观测数据一定是比较集中在均值附近,反之则是比较离散的。 变异系数(Coefficient of Variation或CV) 变异系数是将标准差表示为均值的百分数,是观测数据分散性的一个度量,它在比较用不同单位测量的数据的分散性时是有用的。 5. 表示数据分布形状的统计量 偏度(Skewness):描述数据对称性的指标。 正态分布 如果数据来自正态分布总体,则: 68%的值落在距均值1个标准差的范围之内 95%的值落在距均值2个标准差的范围之内 99%的值落在距均值3个标准差的范围之内 概率P(probability) 概率是度量某随机事件发生可能性大小的一个数量。 概率的取值范围在0~1之间。若某一事件必然不发生,P=0;某一事件必然发生,P=1 概率论是数理统计的基础,统计分析的许多结论,都是建立在概率大小的基础之上的。 [例]儿童体检数据如下 刘明 3 男 0.94 13.59 50.4 蔡行 3 男 0.91 14.2 50 李敏 4 女 1.39 16.15 51.6 李涛 4 男 1.02 15.44 51.9 夏天 4 男 1.06 15.3 51 郭红 5 女 1.01 15.04 51.9 胡月 5 女 1.02 15.07 52.7 程彬 6 女 1.07 17.04 53.7 杨兵 6 男 1.12 18.09 54.1 刘进 6 男 1.14 18.8 53.5 王苗苗 7 女 1.16 19.93 55.5 张思凡 7 女 1.15 18.2 51.4 试用作描述性统计分析 二、用SAS/ASSIST进行描述统计 选择解决方案/ASSIST,并在欢迎窗口中点击继续按钮 选择Cascading Menu为新的ASSIST工作模式;选择Block Menu为ASSIST 6的菜单工作模式。 选

文档评论(0)

ctuorn0371 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档