投影寻踪方法及其应用.pptVIP

  1. 1、本文档共29页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
1 投影寻踪方法的基本原理与建模型步骤 1.1 投影寻踪方法的基本原理 投影寻踪(projection pursuit,PP)方法属于直接由样本数据驱动的探索性数据分析方法。它把高维数据{x(i,j)}通过某种组合投影到低维子空间上{z(i)},对于投影到的构形,采用投影指标函数Q(z(i))来描述投影暴露原系统某种分类排序结构的可能性大小,寻找出使投影指标函数达到最优(即能反映高维数据结构或特征)的投影值z(i),然后根据该投影值来分析高维数据的分类结构特征(如投影寻踪聚类评价模型),或根据该投影值与研究系统的实际输出值之间的散点图构造适当的数学模型以模拟系统输出(如投影寻踪等级评价模型)。 1 投影寻踪方法的基本原理与建模步骤 1.2 投影寻踪方法的建模步骤 步骤1:高维样本数据的预处理,确定系统输入。 步骤2:构造投影指标函数。 步骤3:优化投影指标函数。 步骤4:建立系统模型。 2 基于加速遗传算法的投影寻踪聚类模型AGA-PPCE 2.1 基于加速遗传算法的投影寻踪聚类模型的建立 步骤1:评价指标值的归一化处理。设样本集为{x*(i,j)| i =1~n, j=1~p}。其中x*(i,j)为第i个样本第j个指标值。为消除各指标值的量纲和统一各指标值的变化范围,可采用下式进行极值归一化处理: 2 基于加速遗传算法的投影寻踪聚类模型AGA-PPCE 2.1 基于加速遗传算法的投影寻踪聚类模型的建立 步骤2:构造投影指标函数。PP方法就是把p维数据{x(i,j)| j=1~p}综合成以a=(a(1),a(2), …,a(p))为投影方向的一维投影值z(i) 2 基于加速遗传算法的投影寻踪聚类模型AGA-PPCE 2.1 基于加速遗传算法的投影寻踪聚类模型的建立 步骤3:优化投影指标函数。当各指标值的样本集给定时,投影指标函数Q(a)只随投影方向a的变化而变化。可通过求解投影指标函数最大化问题来估计最大可能暴露高维数据某类特征结构的最佳投影方向 : max Q(a)= Sz Dz (2.4) 加速遗传算法(AGA) 步骤1:模型参数的编码。设码长为e,第j个参数的变化区间为[aj,bj],j=1~p。把这些区间等分成2e-1个子区间: cj=aj+Ijdj (2) 式中子区间长度dj=(bj-aj)/(2e-1)是常数;搜索步数Ij为小于2e的十进制整数,是变数;j=1~p(下同)。把Ij转化成e位二进制数{ia(j, k)|,k=1~e}(下同),即式(3) : 步骤2:初始父代群体的随机生成。 生成n组各p个均匀随机数(简称随机数){u(j,i)|,i=1~n},经下式转换成十进制整数。 Ij(i)=INT[u(j,i)2e] (4) 式中INT为取整函数。由式(3)得对应二进制数ia(j,k,i),它们与n组模型参数cj(i)对应,并把它们作为初始父代个体群。 编码与解码的逻辑过程:cj(i)~ Ij(i)~ ia(j, k,i) 步骤3:父代个体适应能力评价。 把第i组参数代入式(1)得目标函数值fi,fi越小表示模型与观测值拟合得越好,适应能力越强,设第i个个体的适应能力与fi成反比。 构造选择概率序列{pi},把[0,1]区间分成n个子区间:(0,p1),(p1,p2),…,[pn-1,pn],它们与n个个体一一对应,fi越小的个体对应的子区间长度越大。 步骤4:父代个体的概率选择。 生成n个随机数{ ui |i=1~n},若 ui∈[pi-1,pi], 则选取第i个父代个体,其二进制数记为ia1(j,k,i)。同理可得另外的n个父代个体ia2(j,k,i)。选择是遗传算法的关键,它体现了优胜劣汰的思想。 步骤5:父代个体的杂交。 由步4得到的父代个体配对成n对双亲。生成两随机数u1和u2,再转成十进制整数:IU1=INT(1+u1·e),IU2

文档评论(0)

wuyoujun92 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档