描述性统计讲义.ppt

描述性统计讲义.ppt

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Source: /.../L2-1UnderstandingIQ.html Source: CSAP’s Data Pathways “散布”程度的度量 研究数据的散布程度 具有相同中心的不同数据集,散布可以不同 为了解数据集的散布程度,我们需要计算每个数据到中心的距离 和均值一样,仅对区间尺度或者比例尺度下的数据有意义 “散布”程度的度量 Range 样本数据的最大值与最小值之间的距离; 对极值点敏感; IQR:3/4-quantile-1/4quantile 一般和其他工具一起用来描述数据的散布程度 Range Source: / statglos/sgrange.htm Source: /SoSci/converted/Dispersion_I/box_n_hist.gif 样本方差,Sample Variance (S2) Average of squared distances of individual points from the mean High variance means that most scores are far away from the mean. Low variance indicates that most scores cluster tightly about the mean.? Measures of dispersion A summary statistic of how much scores vary from the mean Square root of the Variance expressed in the original units of measurement Used in a number of inferential statistics 标准偏差(SD) 方差 vs. 标准偏差 Population Sample Standard Deviation Variance 分布的偏度 度量数据的分布偏斜程度 中位数和平均值不同时,意味着数据的分布有偏. 当偏斜很严重时候,经常需要对数据进行变换(因为很多统计方法是基于正态假设的) Different Shapes of Distributions Source: /lowry/f0204.gif Skewness of distributions Source: .za/html/govdocs/reports/aids/images/image022.gif Distribution of posting frequency on Usenet 峰度 Kurtosis * Thank you! * Descriptive statistics 描述性统计 for one variable 统计方法的类型 Descriptive Statistics 通过数值和图的方式,清楚明了地对样本数据进行总结描述 Inferential Statistics 对数据来自的总体分布进行推断 描述什么? 数据的“位置”或者“中心” (“measures of location”) 数据的波动 (“measures of variability”). 使用统计方法的原因 有助于总结信息 有助于了解当前数据内在特点 有助于从数据中导出“信息” 有助于交流 数据的类型 根据测量的尺度不同,可以分为: 名义尺度:Nominal scales are read as discrete measurements at each level (no ordering) 顺序尺度:Ordinal measures show tendencies, but categories should not be compared (ordering exists, but not distance) 区间尺度:Interval (distance exists, but no ratios) 比例尺度: ratio scales (ratios exist) all for comparison among categories Frequency distribution 频率分布 频率分布 频率分布是描述一组数据最常用的(图形)工具之一,它有时候也通过罗列观测数据的频率表来表示。? 特点 可以通过直方图、密度直方图、累计频率分布图等等表示 可以描述数据的分布特点 可以推测总体的特征 例:开车最快速度调查数据 分类数据的盒形图 Source: Protecting Children from Harmful Television: TV Ratings an

文档评论(0)

benzei244572 + 关注
实名认证
内容提供者

建筑工程师持证人

没啥好说的额

领域认证该用户于2024年10月16日上传了建筑工程师

1亿VIP精品文档

相关文档