2截面数据分析讲解.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
截面数据分析 (1)由未分组的资料确定中位数。 设有一个含有n个观察值 的样本,把它们从小到大重新排列为 。样本中位数Me: 一般地还称上四分位数为75百分位数(75 pecentile,有75%的观测值小于它),下四分位数为25百分位数(有25%的观测值小于它)。 四分位数的计算也分为两种情况。未分组资料和分组资料。 一般地,k百分位数(k-pecentile)意味着有k%的观测值小于它。 如果令a=k%,则k百分位数也称为a分位数(a-quantile)。 切尾平均(trimmed mean) 切尾平均是去掉大小两端的若干数值后计算中间数据的均值。 EXCEL 均值 中位数 众数 数据1,2,3,4的四分位数。 标准化值 对多个具有不同量纲的指标进行标准化处理,标准化值反映了一组数据中各数值的相对位置。 若数据服从正态分布,位于均值左右3倍标准差之内的数据占99.73%。 左偏、右偏的含义 4、矩法---偏态系数 偏态系数为0为正态分布 偏态系数大于0为右偏分布 偏态系数小于0为左偏分布 比哪个正态分布的峰度高或者低? 正态分布函数的语法是normdist(x,mean,standard_dev,cumulative) x是随机变量值,mean是均值,standard_dev就是标准差啦 cumulative设为0会画出概率密度函数图,设为1画出积累分布函数图 比如,在A列中填充一列等差序列,在B1中输入函数,normdist(A1,7,20,0)得到返回值f,用黑色十字形鼠标自动填充B列中余下数值,以A列为横轴,B列为纵轴,就做出分布图了。 2.矩法----峰度系数 峰度系数为0为正态分布 峰度系数大于0为尖峰分布 峰度系数小于0为扁平分布 描述统计在Excel中的实现 STEP1:用鼠标点击工作表中待分析数据的任一单元格。 STEP2:选择“工具”菜单的“数据分析”子菜单。 STEP3:用鼠标双击数据分析工具中的“描述统计”选项 。 STEP4:出现“描述统计”对话框。 STEP5:填写完“描述统计”对话框之后,按“确定”按扭即可。 结果说明:描述统计工具可生成以下统计指标,按从上到下的顺序其中包括样本的平均值、标准误差、组中值、众数、 样本标准差、样本方差、 峰度值、偏度值、极差、最小值、最大值、样本总和、样本个数和一定显著水平下总体均值的置信区间。 对话框内各选项的含义如下: 输入区域:在此输入待分析数据区域的单元格范围。 分组方式:如果需要指出输入区域中的数据是按行还是按列排列,则单击“行”或“列”。 标志位于第一行/列:如果输入区域的第一行中包含标志项(变量名),则选中“标志位于第一行”复选框;如果输入区域的第一列中包含标志项,则选中“标志位于第一列”。 复选框:如果输入区域没有标志项,则不选任何复选框,Excel 将在输出表中生成适宜的数据标志。 均值置信度:若需要输出由样本均值推断总体均值的置信区间,则选中此复选框,然后在右侧的编辑框中,输入所要使用的置信度。例如,置信度 95%可计算出的总体样本均值置信区间为10,则表示:在5%的显著水平下总体均值的置信区间为( X -10, X +10)。 第 K 个最大/小值:如果需要在输出表的某一行中包含每个区域的数据的第 k 个最大/小值,则选中此复选框。然后在右侧的编辑框中,输入 k 的数值。 输出区域:在此框中可填写输出结果表左上角单元格地址,用于控制输出结果的存放位置。 新工作表:单击此选项,可在当前工作簿中插入新工作表,并由新工作表的 A1 单元格开始存放计算结果。如果需要给新工作表命名,则在右侧编辑框中键入名称。 新工作簿:单击此选项,可创建一新工作簿,并在新工作簿的新工作表中存放计算结果。 汇总统计:指定输出表中生成下列统计结果,则选中此复选框。 人大经济论坛EXCEL专版 /forum-136-1.html 注册后就可用。 是非标志总体的指标 方差 标准差系数 【例】某厂某月份生产了400件产品,其中合格品380件,不合格品20件。求产品质量分布的集中趋势与离中趋势。 是非标志总体的指标 解: 三、数据分布的偏态与峰度的测度 Right-Skewed Left-Skewed Symmetric Mean = Median = Mode Mean Median Mode Median Mean Mode 一、偏度(Skewness)及其测度 偏度是反映数据相对于正态分布的偏斜程度的指标,表

文档评论(0)

w447750 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档