基于核估计的多变量非参数随机模型初步研究.docVIP

基于核估计的多变量非参数随机模型初步研究.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于核估计的多变量非参数随机模型初步研究

基于核估计的多变量非参数随机模型初步研究 王文圣1,丁晶1 (1.四川大学 水利水电学院,四川 成都 610065) 摘要:本文基于核估计理论构造了多变量非参数模型。该模型是数据驱动的、不需识别和假定序列相依形式和概率分布形式的一类随机模型,克服了多变量参数模型的不足。实例统计试验表明,建议的多变量非参数模型是有成效的,为随机水文学发展提供了一些新思路。 关键词:核估计;多变量非参数模型;随机模拟;实用性检验 中图分类号:P333.9??????? 文献标识码:A ??? 流域水资源的开发利用,不仅需要单站水文信息,而且需要流域内各站的水文信息。进行多站水文序列模拟的一个重要手段就是建立多站(变量)随机模型。目前,多变量随机模型[1]比较成熟的有自回归模型和解集模型。这两类模型的共同点是用有限个参数的线性函数关系描述水文现象。因此简便实用,能表征水文序列的统计特性和一般变化规律,但缺点也明显:①水文序列是一时间不可逆过程,而参数模型描述的是可逆过程,因此大多数参数模型难以反映其涨落不对称性;②水文现象受流域下垫面、人类活动、气候等多因素影响而变化错综,是一个高度复杂的非线性系统,而多数参数模型仅能表征变量及变量之间的线性相依结构,忽略了占据重要位置的非线性性;③水文变量概率密度函数复杂且未知,某一指定概率分布与真实分布存在着差异。如图1、2所示,正态分布、P-Ⅲ型分布都与直方图相差甚远,但χ2检验并不拒绝P-Ⅲ型分布和正态分布;而核估计和k最近邻估计与直方图比较接近。即概率分布具有不确定性;④模型参数由于抽样误差和估计方法不同具有不确定性。 ??? 为克服参数模型之不足,文献[2]提出了单变量非参数模型,径流模拟表明是满意的。在此基础上,本文基于核估计理论构造了多变量非参数模型。该模型避开了序列相依形式和模型结构的假设,不涉及模型参数估计,能反映各种复杂关系,较参数模型优越。以中国金沙江流域屏山站和宜宾—屏山区间两站日流量过程随机模拟为例,对建议模型进行了应用研究。 1 核估计理论[3] 1.1 多维核估计定义 设X为d维随机变量,X1,X2,……Xn为X的一样本。X的概率密度函数f(X)的核估计定义如下: (1) 式中:X=(x1,x2,…,xd)T,Xi=(xi1,xi2,…,xid)T(i=1,2,…,n);K(·)为核函数,是一给定概率密度函数;h为带宽系数;n为样本容量;S是X的d×d维对称样本协方差矩阵。 1.2? 核估计精度评价? 核估计既同样本有关,又与K(·)和h的选取有关。在给定样本后,核估计的精度取决于K(·)及h的选取是否适当。常采用积分均方误差准则 进行度量。MISE由偏差和方差组成。当K(·)固定时,若h选得过大,偏差较大,但降低了方差,故(X)对f(X)有较大的平滑,使得f(X)的某些特征被掩盖起来;若h选得过小,偏差减小了,但增大了方差,则(X)有较大的波动。显然同时减少偏差和方差是不可能的。 图1 屏山站1月31日流量概率密度估计 图2 宜-屏区间7月径流量概率密度估计(图例见图1) 1.3 K(·)和h的确定 依潘涅契科夫[4]和Scott[5]通过统计试验发现,当给定带宽系数,不同核函数对MISE的影响是很小的。实际工作中,选择满足一定条件的核函数即可[2]。本文采用标准高斯函数。 ??? h随n增大而减小。h的确定还要考虑数据的密集程度,在数据密集区,h选小一点;在数据稀疏区,h选大一点。h的具体计算方法很多。这里使用LSCV法。LSCV是基于积分平方误差(Integrated Square Error(ISE))最小准则的一种计算方法。对多维随机变量X,ISE为: (2) 式(2)中最后一项与h无关。LSCV就是取式(2)中前两项进行最小化,即 (3) 式中:当LSCV(h)最小时,h即为所求。 2? 基于核估计的多变量非参数随机模型 2.1 模型建立 所谓多变量,可以是同一测站的几个水文变量,也可以是不同测站上的一种或几种变量。设{Xt}n(t可以是年,也可以是季、月、日)为多变量相依时间序列,Xt依赖于前P个值Xt-1,Xt-2,…,Xt-p,取Vt=(Xt-1,Xt-2,…,Xt-p)T,Xt的条件概率密度函数为: (4) (4)式中: ,m为变量个数, 为j变量t时刻水文变量值;f(Xt,Vt)为m(P+1)维联合密度函数,fV(Vt)为mP维边缘密度函数。 ??? 由多维核估计知 (5) (6) 其中 (7) 式中:S为(Xt,Vt)的样本协方差矩阵;SX为Xt的m×m阶对称样本方差阵;SXV为Xt与Vt的m×mP阶样本协方差阵;SV为Vt的mP×mP阶对称样本方差阵。Vi=(Xi-1,Xi-2,…,Xi-p)T,Xi=(x(1

文档评论(0)

shenlan118 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档