- 1、本文档共27页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
數据的分布
课 时 授 课 计 划
课次序号: 02
一、课 题:§1.2 数据的分布
二、课 型:新授课
三、目的要求:1.掌握常见的数据分布及分布的拟合检验;
2.掌握运用SAS软件(Univariate 、Capability过程)对数据分布进行拟合检验.
四、教学重点:数据分布的拟合检验.
教学难点:数据分布的拟合检验.
五、教学方法及手段:传统教学与上机实验相结合.
六、参考资料:1.《实用统计方法》,梅长林,周家良编,科学出版社;
2.《SAS统计分析应用》,董大钧主编,电子工业出版社.
七、作业:1.3
八、授课记录:
授课日期
班 次
九、授课效果分析:
复习
1.数据的数字特征:均值、分位数、三均值;方差、标准差、变异系数,四分位极差、截断点;偏度、峰度.
§1.2 数据的分布
数据的数字特征刻画了数据的主要特征,而要对数据的总体情况做全面描述,就要研究数据的分布,通过对数据分布的研究进一步了解理论分布的类型和特征,从而获得总体的信息,主要描述的方法:直方图、茎叶图.
1.2
一.常用的参数分布类型
(1)正态分布
密度 (1.13)
.
(2)对数正态分布
(1.14)
背景:如一变量可看成许多独立因子之和,近似正态分布.如股票投资长期收益可看成每天收益率的乘积.
(3)指数分布
(1.15)
,
背景:产品失效是偶然失效时,寿命服从指数分布,失效率与时间无关.从任一时刻算寿命服从同样的指数分布.可视为威布尔的情形.
(4)Gamma分布
(1.16)
,
背景:用来表示早期失效、偶发失效、耗损失效等不同的寿命分布,比指数、正态分布更具有普遍性.适用于各种形式的分布.
(5)Weibull分布
(1.17)
,
背景:由瑞典物理学家Wallodi Weibull于1939年引进,是可靠性分析及寿命检验的理论基础.
(6)Beta分布
(1.18)
,
背景:常见分布中少数取值在一有限区间的分布,可当作取值在之间总体的概率模式.
其它分布举例
二项分布
泊松分布
均匀分布 ,
分布
分布 ,
分布 ,
密度函数
, .
注意:10
20 来自总体,为样本方差,则
二.直方图
对数据分布为连续型的,常用直方图描述.
1.做分组区间
将数据取值分为若干个区间(一般取等间隔),每个区间长称为组距.
,
2.画直方图
考查数据落入每一区间频率或頻数,每一区间画一矩形,宽度为组距,高为頻数、频率或頻数/组距,称为直方图.如高为,则每组矩形的面积恰为数据落入该区间的概率,其边缘曲线可作为总体密度的估计.
注意:组距的选取对直方图形态有很大影响.组距太小,每组頻数少,图形反映的密度形态有较大波动; 组距太大,直方图不能很好地反映概率密度形态.合理的组距是希望形态接近总体密度曲线.SAS系统的Proc Capability过程可根据样本容量和样本值取值范围匹配一个合适的分组方式,以作出数据分布的直方图,并提供了拟合几种常见分别的选项.
00
00
00
00
00
00
00
00
00
直方图
3.参数分布拟合检验
直方图的边缘曲线为阶梯型,而一些概率密度曲线是光滑的.因此,需要根据直方图大体形状,确定密度曲线,在限定的参数分布中,利用数据估计其中的参数,选出最接近的密度曲线拟合直方图边缘曲线,并作检验.
三.经验分布函数
总体的分布函数为,样本观测值,经验分布函数
(1.19)
其中是示性函数,
为分段右连续阶梯函数,充分大时,.
SAS系统Capabilty过程可做出及拟合的图,并从直观上拟合的好坏.
四. QQ图
直方图、经验分布图判断样本分布是否近似某种类型的分布是困难的,QQ图则可以帮助从直观上做出这方面的判断.
设样本值,顺序统计量.为标准正态分布的分布函数, 为反函数.QQ图为以下点构成的散点图:
(1.20)
注意:10 当样本数据近似服从正态分布,则QQ图近似一条直线 ,斜率,截距为,此时可认为样本数据来自正态总体;
22 当样本不是来自正态总体,则QQ图是弯曲的,可由形状判断偏度和峰度的正负.
您可能关注的文档
- 數据挖掘在物流管理中的作用及应用.doc
- 數据挖掘在淘宝卖家评论中的应用.doc
- 數据挖掘在电子商务中的应用.doc
- 數据挖掘在移动通信决策支持系统中的应用.doc
- 數据挖掘在营销中的应用.docx
- 數据挖掘在软件工程中的应用.doc
- 數据挖掘在采矿工程中的应用.doc
- 數据挖掘基于贝叶斯算法及KNN算法.docx
- 數据挖掘大作业结果分析报告.docx
- 數据挖掘技术在电视邮件播发中的应用有线电视技术稿.doc
- 2.1 立在地球边上放号 课件(共52张PPT).pptx
- 3.2国际关系 教案-2025-2026学年高中政治统编版选择性必修一当代国际政治与经济.doc
- 部编版高中语文选择性必修上册第一单元中国革命传统作品研习2篇目二:大战中的插曲教学课件(共25张PP.ppt
- Unit 5 Off to space 词性转换A篇(背诵版)【沪教2024版七年级上册英语】.doc
- 皓元医药三大引擎驱动能力不断拓展.pdf
- 风机行业专题:国内陆风盈利修复,出口迎来放量拐点.pptx
- 装备体系视角下我国的军贸出口机会.pptx
- 农林牧渔行业专题:近期宠物行业更新.pptx
- 机械设备行业深度报告:智元机器人控股上纬新材,中标中国移动人形机器人代工订单.pdf
- 久期轮动策略创新及债券ETF组合应用.pptx
最近下载
- DB63∕T 2387-2024 公路路基涎流冰防治技术指南.pdf
- 2025人教版英语四年级上册Unit 1 Helping at home单元测试试卷.pdf VIP
- 等比数列知识点总结与典型例题+答案.docx VIP
- 1、2024广西专业技术人员继续教育公需科目参考答案(98分).pdf VIP
- 配电运维题库题库(392道).docx VIP
- 中华优秀传统文化融入初中英语教学的路径探索.docx VIP
- 2025年生产安全应急演练方案(精选5篇).pdf VIP
- 2025安徽合肥高新区管委会直属国有企业公开招聘31人笔试历年参考题库附带答案详解.docx
- SY∕T 5329-2022 碎屑岩油藏注水水质指标技术要求及分析方法.pdf
- 电线、电缆载流量对照表.pdf VIP
文档评论(0)