- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
本章重点 詹姆斯 杜兰特 詹姆斯 杜兰特 詹姆斯 分布形态 钟型分布(bell shaped) 钟型分布中间观测值分布多,越往两侧分布越少。因其形状像钟而得名。 根据分布的对称性,钟型分布又可分为对称分布、左偏分布和右偏分布 对称分布(symmetry) 左偏(left skewed) 右偏(right skewed) 正态分布(normal distribution) 也叫高斯分布(gaussian distribution)是一种完美的、对称的钟型分布,可以用函数精确地表达出来 实践中大量的变量逼近正态分布,换而言之,一个变量大约成正态分布才是正常(normal)的 杜兰特 对比 双直方图( bi-histogram) 对比 描述 位置(location):中心(center) 尺度(scale):差异(variability)或离散(spread) 形态(shape) 第一节 位置 均值(mean) 众数 (mode) 中位数 (median) 分位数 (quantile) 均值 中位数 中间位置上的数 观测值从小到大排列 中间位置:(n-1)/2+1 中位数 排序: 中间位置:(n-1)/2+1=(101-1)/2+1=51 中位数:31 众数 分布次数(频数)最多的观测值 次数分布 找到分布最多的观测值 众数不一定存在,也不一定唯一 事实上,连续型变量很难精确地找到众数 众数位置 分布 众数 位置:最多分布为9 众数:33 分位数 q分位数:观测值从小到大排序后,q等分,处于分界点上的数 二分位数(中位数) 三分位数(tertiles) 四分位数(quartiles) 五分位数(quintiles) 六分位数(sextiles) 十分位数(deciles) 十二分位数(duo-deciles) 二十分位数(vigintiles) 百分位数(percentiles) 千分位数(permilles) 四分位数 观测值按大小顺序排列后,均分为四部分,处于分界点上的数 2/4位置:中位数 1/4位置:下四分位数 3/4位置:上四分位数 四分位数 詹姆斯: 杜兰特: 月薪 从某公司随机抽取13位职工,调查他们的月薪如下: 2000 2600 3500 1800 2500 4800 2800 3000 2200 3300 5200 4600 4000 四分位数位置 十分位数位置 分位数位置 第k个q分位数的位置: 位置汇总 均值:27.13 中位数:26 众数:25 下四分位数:22 上四分位数:32 练习 第二节 尺度 绝对平均差(average absolute deviation) 方差(variance) 标准差(standard deviation) 全距(range) 四分位距(inter-quartile range) 绝对中位差(median absolute deviation) 散点图 差异( 离散) 中心化( centering) 中心化 合计 绝对值 绝对平均差 平方 方差 自由度 计算样本方差时应除以n-1,而不是n 自由度? 标准差 变异系数( coefficient of variation) 全距 四分位距 绝对中位差 尺度汇总 绝对平均差: 6.31 方差: 67.3 标准差: 8.20 变异系数:0.302 全距: 54 四分位距: 10 绝对中位差:5 总体均值和方差 练习 极端值(extremes) 也叫离群值(outliers),指明显偏离主体数据的值。极端值应给予特别关注: 观测错误 特殊情况 判定 3倍标准差 1.5倍四分位距 准则 标准化(无尺度化) 准则 讨论 月薪 正常数据 有极大值数据 右偏 月薪 正常数据 有极小值数据 左偏 月薪 正常数据 既有极大值,又有极小值数据 尖峰(厚尾) 销量 正常数据 有极大值数据 位置描述 均值:50.1 中位数:48.5 众数:47 尺度描述 绝对平均差: 9.87 方差: 171.4 标准差: 13.1 变异系数:0.26 全距: 58 四分位距: 10 绝对中位差:6.5 稳健(robust) 诸如中位数、四分位距、绝对中位差的只受主体数据影响不受极端值影响的统计量成为稳健统计量 稳健统计量意味着缺乏敏感性 调整均值 中间均值(mid-mean):用25%——75%分位数之间的数据计算均值 切尾均值(trimmed mean):用5%——95%分位数之间的数据计算均值 缩尾均值
您可能关注的文档
- 首件盖梁施工方案解析.doc
- 通过激素的调节课件解析.ppt
- 首届结核病防治知识网络竞赛试题与答案解析.doc
- 通过激素调节(一轮复习)解析.ppt
- 首特八区机电施工组织设计解析.doc
- 首选可达龙还是等利多卡因无效后使用解析.ppt
- 通过聚氨酯-角蛋白混合膜去除水中的六价铬解析.doc
- 首医内科学内分泌专业题库修改题解析.doc
- 寿力空压机常见问题及应急处理办法解析.ppt
- 寿险业务流程(新契约)解析.ppt
- 2025年无人机低空医疗物资投放社会效益报告.docx
- 2025年再生塑料行业包装回收利用产业链重构研究.docx
- 《AI眼镜周边产品市场机遇:2025年终端销售与需求增长洞察》.docx
- 2025年坚果加工行业深加工技术突破与市场拓展策略报告.docx
- 2025年通信芯片行业技术竞争与未来趋势报告.docx
- 《2025年生鲜电商配送冷链事故分析与预防措施》.docx
- 《商业航天融资新趋势2025民营卫星企业资本涌入估值分析市场动态》.docx
- 2025年能源绿色健康行业创新技术与市场应用报告.docx
- 2025年无人机低空医疗救援通信方案分析报告.docx
- 2025年烹饪机器人行业市场集中度分析报告.docx
最近下载
- 中国马克思主义与当代 2024版 教材课后思考题答案.docx
- 人工智能推动医学研究的创新突破.pptx VIP
- 玄隐遗密(含黄帝内经).pptx VIP
- 《社会调查研究与方法》期末复习考试题库(带答案).docx VIP
- 创业基础(暨南)中国大学MOOC慕课 章节测验期末考试答案(期末考试题目从章节测验中选出,题目没对上,可以在章节测验中查找).docx VIP
- 消防中级维保考试题库2000题.pdf
- 眼的解剖与生理.ppt VIP
- 上汽荣威R550维修手册1_描述与运作 ——原厂 2009 390 页 pdf.pdf VIP
- 学习华为:以客户为中心的营销体系.pptx VIP
- 家长会心得体会五年级简短9篇.docx VIP
原创力文档


文档评论(0)