- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
例:用车辆数目数据即:第30页,共70页,星期日,2025年,2月5日4.5拟合度检验通过做辨识和参数估计,可以估计出观测样本的分布及其参数。在得到了这个估计的理论分布及其参数之后,需要判断观测样本分布与估计的理论分布的接近程度,即确定估计的理论分布的拟合度。比较直观的方法之一是直接把直方图与所估计理论分布的概率密度函数曲线做对比。假设所估计理论分布的概率密度函数为,对于连续型随机变量,比较的具体方法是:把直方图与Δb曲线画在一起。第31页,共70页,星期日,2025年,2月5日例:我们估计汽车银行顾客到达时间间隔服从=2.506的指数分布,将直方图与概率密度曲线做对比。拟合样本数据得到顾客到达间隔时间的概率密度函数,直方图与画在一起:第32页,共70页,星期日,2025年,2月5日第33页,共70页,星期日,2025年,2月5日拟合度检验的定量方法:χ2检验(Chi-SquareTest)Kolmogorov-Smirnov检验(柯尔莫哥洛夫-斯米尔诺夫检验、K-S检验)第34页,共70页,星期日,2025年,2月5日4.5.1χ2检验(Chi-SquareTest)χ2检验以下假设是否成立。H0:随机变量X满足假定的分布;如果H0假设被接受,那么被检验的随机变量就满足所假定的分布;如果H0假设被拒绝,则被检验的随机变量不满足所假定的分布。第35页,共70页,星期日,2025年,2月5日χ2检验的方法:(1)将n个观测样本按数值大小分到k个相邻区间[aj-1,aj)(j=1,2,…,k)中,按照公式计算χ2统计量。其中Nj为在第j个区间中的观测样本数,pj为按照假设的分布确定的样本在该区间中出现的概率。对于连续型变量,对于离散型随机变量,是所假设的分布的概率密度函数,是所假设的分布的概率质量函数。第36页,共70页,星期日,2025年,2月5日(2)χ2服从k-s-1自由度的Chi-Square分布。k为所划分区间的数目,s为所假定的分布的参数数目。如果则H0假设被拒绝。α是显著水平,相应的(1一α)×100%就是置信度。第37页,共70页,星期日,2025年,2月5日不要求k个相邻区间的宽度都相等。对于离散型随机变量,区间的数量由观测样本的取值数目确定;对于连续型随机变量,区间数量采用表4.8中的推荐值。第38页,共70页,星期日,2025年,2月5日例4.6:在5分钟内到达十字路口西南拐角的车辆数目被假设为服从泊松分布,通过参数拟合得到λ=3.64。在显著水平α=0.05时,用χ2测试检验在5分钟内到达十字路口西南拐角的车辆数目是否服从所假设的泊松分布。离散泊松分布的概率质量函数为,第39页,共70页,星期日,2025年,2月5日表4.9是按照离散泊松分布的概率密度函数计算出的整数X取值0-11时的概率质量。将总共100个样本值分为7个相邻的区间,再根据离散泊松分布的概率密度质量计算出,如果满足所假定的泊松分布,在每个取值区间内应该出现的样本数目npi;。pi为所假设的泊松分布取第i个区间中的数值的概率质量,n为全部样本的数目。检测统计量的计算过程在表4.10中列出。第40页,共70页,星期日,2025年,2月5日统计量显著水平取为α=0.05。泊松分布有一个参数,则上分布的自由度为,k-S-1=7-1-1=5查表可得关键值,因此在显著水平取α=0.05,H0假设被拒绝,即样本数据不服从所假定的泊松分布。第41页,共70页,星期日,2025年,2月5日在计算χ2统计量时,Ni是分段区间中所包含的样本数量,换算成占全部样本的比例就可以得到直方图。pi则是所假设的理论分布的数值出现在分段区间内的概率,代表了概率密度函数或概率质量。χ2统计量可以被理解为直方图与概率密度函数曲线或线图与概率质量函数曲线偏差曲线的偏差量,χ2测试则是定量化的直方图与概率密度或线图与概率质量函数曲线对比方法。采用χ2测试需要确定分段区间,如何确定分段区间没有严格的规则,区间数量不同对统计量有比较大的影响。对于同一组样本,在选择某个区间数量时,得到了样本不服从所假设分布的结论;选择另外的区间数目,则可能得出样本服从所假设分布的结论。另外,当样本数量比较少的时候,不能采用χ2测试。第42页,共70页,星期日,2025年,2月5日4.5.2Kolmogorov-Smirnov检验K-S检验是把经验分布函数与所假设分布的分布函数做比较。使用K-S检验不
原创力文档


文档评论(0)