- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
流域年均含沙量的PP回归预测_计算机论文.doc
流域年均含沙量的PP回归预测_计算机论文
流域年均含沙量的PP回归预测_计算机论文
摘要:应用投影寻踪回归技术,建立了流域年均含沙量的预测模型。用降雨量和年平均径流等4个因子建立的某流域平均含沙量的PPR预测结果的拟合合格率达100%,预留检验样本报准率为75%,表明PPR用于泥沙输移规律的预测研究是可行的。 关键词:流域 输沙量 投影寻踪回归 预测 1 引言
我国是一个水土流失严重的国家。严重的水土流失给工农业生产和国民经济建设造成巨大危害。产沙量是反映水土流失的一个重要指标。而气象要素、地形、土质状况、植被系统及人类活动均对产沙量有重要的影响。国内外不少学者针对不同的地域特征,对流域的产沙机理,泥沙输移规律及其防治对策等进行了大量的研究[1,2],但对诸多因子与产沙量之间的定量研究进行得较少。考虑到引起泥沙流失的诸多因子与产沙量之间的关系具有高维和非线性的特点,而传统的统计预报方法是采用“从某些假定出发,按照一定准则,找出最优拟合”这样一条途径,难以适应千变万化的客观世界,也就无法真正找出数据的内在规律。这种传统的预报方案往往是还原拟合较好,但预留实况检验的精度很差。近20年来,在统计学中提出了一条“审视数据,模拟,预报”称为探索性数据分析(EDA)新途径。本文正是采用基于这种新思路,应用投影寻踪回归技术(PPR),建立流域产沙量的多因子预报模型。
2 PPR原理及算法简介
投影寻踪是国际统计界70年代兴起的高新技术,是应用数学,统计学和计算机技术的交叉学科,属前沿领域。
PP是用来分析和处理高维数据,尤其是来自非正态总体高维数据的一类新兴统计方法[3]。其基本思想是:利用计算机技术把高维数据通过某种组合投影到低维子空间上,寻找出能反映原高维数据结构或特征的投影,在低维上对数据结构进行分析,以达到分析研究高维数据的目的。
传统的诸多线性模型通常局限于正态分布,但多数实际问题却不呈线性,因此勉强用线性手段进行辩识和预报,很难取得好的效果。而PP与其它非参数法一样,它可用来解决某些非线性问题。它虽然是以数据线性投影为基础,但它寻找的是线性投影中的非线性结构。因此,它可用来解决一定程度的非线性问题。PPR模型如下:设是一P维随机向量,Y=f(X)是一维随机变量,为了避免线性回归不能反映实际非线性情况的矛盾,PPR采用一系列岭函数的和来逼近回归函数的方法,即(1)
式中Gm(Z)表示第m个岭函数,Z=()为岭函数的自变量,它是向量在方向上的投影,也为某方向的P维向量,M为岭函数的个数。
Friedman和Stuetzle提出了实现PPR的SMART多重平滑回归技术,SMART模型具有如下形式 它实际上是采用分层分组迭代交替优化方法对式(2)中的参数,β,Mu和岭函数Gm寻优。实现步骤为
①给定一个初始模型;
②把数据投影到一个低维空间上,找出数据与现有模型相差最大的投影,这就表明在这个投影中含有现有模型中没有反映的结构;
③把上述投影中所包含的结构并到现有模型上,得到改进了的新模型
④再从这个新模型出发,重复以上步骤,直到数据与模型在任何投影空间都没有明显的差别为止。
模型的关键是最终估计出式(1)的参数:岭函数最优化项数Mu,岭函数Gm,系数αjm ,βm。其判别准则仍是:选择适当的参数组合,使式(3)
具体作法是:把全体参数分成几组,除其中一组外,都给定一初值,然后对留下的一组参数寻优。得到结果后,把这一组参数的极值点作初值,另选一组参数在这一初值下寻优。多次重复直到参数收敛为止,即将及岭函数Gm划入一组,m=1,2,………M,共有M组。固定其中的M-1组,而对这一组ajm ,βm,Gm优化求解。此时,又将其分成三个子组,分别固定其中的两个子组,对第3子组优化。然后重复这一过程,直到收敛为止,即L2不再减小为止。
用SMART计算软件进行PPR计算时,实际操作十分简单,因为模型只有岭函数的光滑系数S,岭函数个数的上限M及最优个数Mu3个参数需要调整。光滑系数S确定着数据平滑窗口的大小,其取值范围S∈[0.1,0.9],考虑到在满足一定精度条件下,尽可能缩短模型运行时间,要求Mu≤M≤9,通常取下面这些组合:“M,Mu”为“5,3”;“6,5”;“6,4”和“9,6”等,其最佳值最终由计算结果分析确定。此外,样本容量值N可在不超过500范围内自行指定,屏显值与指定值N之差由程序自动视为预留检验样本数。PPR的理论分析及算法详见文献[4,5]。 3 某流域的年均含沙量的PPR回归预测
一般说来,流域的年均含沙量受多种因素影响,但对具体流域必须具体分析。其因子选择原则应尽可能选择那些与年均含沙量相关性好,而又比较稳定的有明确物理成因的因子作为PP回归建模因子。经分析,引起该流域含沙量
您可能关注的文档
最近下载
- 标准的个人简历表格[空白].doc VIP
- 开放系统11879《小学语文教学研究》期末机考真题及答案(第102套).docx VIP
- 2025年新教科版科学四年级下册全册知识点(超全版).pdf
- 《sm-3酶标仪说明书》.doc VIP
- 3篇《严禁违规操办“升学宴廉政承诺书》谈话记录.docx VIP
- 2025中国工商银行软件开发中心社会招聘笔试备考题库及答案解析.docx VIP
- 老年常见病的预防与照护教学大纲.docx
- 六年级科学上册(教科版)全册同步练习(含答案).pdf VIP
- 2025年新人教版七年级下册历史全册知识点(新教材).pdf VIP
- 基于项目式学习的初中生物综合实践活动案例论文.docx
文档评论(0)