第5章 持续变量的统计描述与参数估计.pptxVIP

第5章 持续变量的统计描述与参数估计.pptx

  1. 1、本文档共18页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第5章 持续变量的统计描述与参数估计

第5章 连续变量的统计描述与参数估计;统计分析的目的是研究总体特征; 统计方法分为描述性统计分析及推断性统计分析: 描述性统计分析——对数据进行描述的统计方法; 推断性统计分析——从样本信息回推总体特征的统计方法。;各种统计描述指标(统计量,summary statistic),也称汇总统计量或概括统计量,用少量数据概括大量数据的技术。 针对不同测量类型的变量,有不同的描述指标体系及统计图形与之对应。 分类变量的描述统计量,如频数、频率;连续变量的描述统计量,如均数、标准差。;5.1 连续变量的统计描述指标体系;5.1.1 集中趋势的描述指标 集中趋势(Central Tendency),又称“位置统计量”(Location Statistic),即数据分布的中心位置的统计量,包括算术均数、中位数、众数、截尾均数。;截尾均数: 由于均数较易受极端值的影响,因此可以考虑将数据进行排序后,按照一定比例去掉最两端的数据,包括中部的数据来求均数。 如果截尾均数及原均数相差不大,则说明数据不存在极端值,或者两侧极端值的影响正好抵消。 常用的截尾均数有5%截尾均数,即两端各去掉5%的数据。 在SPSS中“探索”(Explore)过程可以自动计算5%截尾均数。;5.1.2 离散趋势的描述指标 离散趋势(Dispersion Tendency),又称“尺度统计量”(Scale Statistic),即可以反映数据波动范围的大小的统计量,包括全距、方差、标准差、百分位数、四分位数、四分位间距、变异系数。;变异系数: 当需要比较两组数据离散程度大小的时候,往往直接使用标准差来进行比较并不合适。这可以被分为两种情况:一是测量尺度相差太大;二是数据量纲不同 。 变异系数(coefficient of variation,简称CV ) 可以消除测量尺度及量纲的影响 。它是标准差与其平均数的比率。计算出的变异系数没有量纲,同时又按照其均数大小进行了标化,这样就可以进行客观的比较。 ;5.1.3 分布特征、其他趋势的描述指标 分布特征(Distribution Tendency),又称“形态统计量”,即描述数据偏离分布程度的统计量,包括偏度、峰度。 其他趋势,是统计描述的其他指标,包括单峰或双峰分布、M统计量、极端值列表等。;5.1.4 SPSS中的相应功能 用于连续变量统计描述的过程,均集中在“描述统计”(Descriptive Statistics) 子菜单中: 1.频率过程(Frequencies) 该过程特色是产生原始数据的频数表,并能计算各种百分位数,描述指标包括集中趋势、离散趋势、百分位数及分布指标四部分,能绘制统计图。;2.描述过程(Descriptives) 该过程适用于对服从正态分布的连续性变量进行描述,它不能绘制统计图、所能计算的统计量较少,使用频率很高。 3.探索过程(Explore) 该过程用于对连续变量分布状况不清楚的探索性分析,可计算许多描述性统计量(如均数、百分位数、截尾均数、极端值列表),绘制统计图及参数估计; 4.比率过程(Ratio) 该过程用于对两个连续变量计算相对比指标,可计算专业的相对比描述指标。;5.2 连续变量的参数估计指标体系;5.2.3 参数的区间估计 1.标准误 样本均数的标准差,称均数标准误,或称标准误差。 2.区间估计的计算 可信度或置信度(1-α); 可信区间或置信区间; 显著度或显著性水平( α )。;5.2.4 SPSS中的相应功能 SPSS的许多过程均可完成连续变量参数估计的任务,针对性较强的是描述统计子菜单中的过程: 1.描述过程 将原变量转换为标准正态分布的得分,选择“将标准化得分另存为变量”复选框。;2.探索过程 可计算标准误,还可以直接给出均数95%可信区间,以及提供稳健估计值。 3.P-P图及Q-Q图 用图形方式直接观察样本数据分布是否服从所假设的理论分布,如正态分布。 ;5.3 案例:信心指数的统计描述;5.3.2 使用描述过程进行分析 1.界面说明 2.操作说明与结果解释 5.3.3 使用探索过程进行分析 例5.2 分月份对总指数index1进行描述 1.界面说明 2.基本输出结果 3.M-统计量 4.极端值列表 5.百分位数;5.4 Bootstrap方法

文档评论(0)

f8r9t5c + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8000054077000003

1亿VIP精品文档

相关文档