- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
【要点详解】 §10.1 引言 一般来说,对模型的筛选将经历如下的过程: 第一:被选模型与实际数据图形上的直观比较和筛选; 第二:用统计学方法对模型分布函数与经验分布函数进行检验(如 拟合优度检验、K-S检验、Anderson-Darling检验等); 最后:由一定的标准进行模型选择(常用主观判断法和评分法)。 §10.2 模型的直观选择 1.数据与模型的表示 本章中只讨论在同一点截断或删失数据。 假设数据集的截断点是t,则经验分布的起始点也是t。为了和经验值进行比较,使用的模型必须是截断的。因此,截断后的模型表示为: 其中F(x)、f(x)表示没有截断的模型。 2.密度函数与分布函数的图像比较 (1)对模型拟合程度最直接的检验方法是做图。一般选用经验分布图(卵形图)、直方图、核密度图等与备选模型的分布函数或密度函数图进行比较。当模型与样本的分布图像比较接近时,可以使用该函数拟合样本数据。如果差异较大,超出了可以接受的范围,则认为不能使用该函数进行拟合。 (2)当模型的分布函数和经验分布函数很接近时,很难从图像上分辨出细徽的差别。可以直接画出两个函数差值的图像。也就是说,如果Fn(x)和F*(x)分别表示经验分布函数和由模型得到的分布函数,画出D(x)=Fn(x)-F*(x)的图像即可。 3.p-p图和Q-Q图比较 (1)p-p图 ①p-p图(概率图):是根据变量的经验分布与指定分布的累积分布函数之间的关系所绘制的图形。可以检验数据是否符合指定的分布。 ②p-p图检验数据的步骤 首先将观测值排序xl≤…≤xn;再对每个值构造坐标(Fn(xj),F*(xj));最后将每个坐标对应的点画在(Fn(x),Fn*(x))的平面上。 ③p-p图检验的结果分析 当数据符合指定分布时,p-p图中各点近似呈一条45°直线。但是,在这种情况下,必须对经验分布函数的定义有所修改。 如果p-p图中各点不呈直线,但有一定规律,则可以对变量数据进行转换,便转换后的数据更接近指定分布。 (2)Q-Q图 Q-Q图是用样本数据的经验分位数与所指定分布的分位数之间的关系曲线来进行检验的。 (3)p-p图和Q-Q图分析注意事项 当分析p-p图和Q-Q图时,最好不要用严格的标准去衡量这些数据是否在一条直线上,通常只要看这些点是否近似在一条直线上即可。另外,当判断概率图上的点是否近似在一条直线上时,对样本点中两端的点可以不用关注,除非这些点偏离直线特别远,但是当有一个样本点偏离直线特别远,而其他样本点又基本近似在直线上时,偏离直线的那个样本点则视为离群点,不用考虑。 4.平均剩余寿命函数图 (1)平均剩余寿命函数 平均剩余寿命函数考虑的是数据在尾部的情况,其定义为: e(d)=E[X-d|Xd] 如果平均剩余寿命函数随d递增,那么在变量取值较大处的期望结果会很大,因此概率向右移,说明其尾部相比那些平均剩余寿命函数递减或增速较慢的模型更厚。反之,如果平均剩余寿命函数随d递减,说明X的分布是轻尾分布。 (2)平均剩余寿命函数图 通过样本平均剩余寿命函数图 观察样本数据的尾部特征。使用经验估计二 来代替e(d),有: 如果平均剩余寿命函数图呈现上升的趋势,说明样本的损失分布是一个明显的厚尾分布;而如果呈现下降的趋势则是轻尾分布;指数分布的平均超额函数图近似为一条水平的直线。 §10.3 分布的拟合优度检验 在假设检验中,先要设定原假设和备选假设: H0:数据来源于某个给定的总体; H1:数据并非来源于给定的总体。 针对原假设的不同,有两种处理的方式。如果原假设中给出了完整的模型,检验临界值可以较为容易地得出;如果原假设仅仅指明了模型的类型,而模型中仍含有待定的参数,如果模型的参数是通过样本数据估计得出,这时的检验统计量要比事先给定模型时的统计量要小。通常统计量较大时容易拒绝原假设,因此这种近似增加了犯第二类错误的概率,同时减小了犯第一类错误的概率。 针对第二种情况,通过将样本随机分组的方式避免近似。将样本随机分为两部分,一部分进行参数估计,另一部分进行假设检验。当模型选定之后,又重新将所有数据用于参数估计。 1. 拟合优度检验 拟合优度检验常用于离散分布的情况,如果是连续分布则需要把数据分成多个区间来考虑。 (1) 拟合优度检验验的步骤 ①选定任意k-l个值使得t=c0c1c2c3c4…ck=∞,其中t为左截断点(如果没有截断则t=0)。记
文档评论(0)