GEP技术剖析.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
GEP技术剖析

1.1.1 编码问题 1 1.1.2 初始群体的形成 3 1.1.3 适应度评价 3 1.1.4 选择运算 4 1.1.5 交叉与变异 6 1.1.6 发现算法 7 遗传算法GEP与函数发现 发现函数依赖关系表达式最大的特点就在于函数类型的未知性在有实验观察数据而对事物内在机制不了解的情况下,其函数类型是未知的对函数形式假设,例如设定其为多项式或幂函数,可能导致挖掘结果的不准确遗传算法的理论与技术研究主要包括编码、选择运算、交叉运算、变异运算以及适应度评价等问题。编码是遗传算法要解决的首要问题。密执安大学教授许多遗传算法的应用,特别是在工业工程中的应用,这种简单的编码方法很难直接描述问题的性质针对特殊问题一个函数关系 z = f (x, y),对表达式 f (x, y) 根据其语义表示为表达式进行编码树,然后从上到下,从左至右按层遍历,得到的符号序列即为基因编码。 例如表达式X它构成了数学表达式的基因编码的主体将 K 表达式按以上过程的逆过程进行便能解码得出对应的数学表达式。编码串的长度是固定的,它由位于前端的K表达式和后面的填充部分组成。,编码被分为头部和尾部两部分,头部可以出现运算符和变量,而尾部只能出现变量。数学表达式设头部的长度为h,在任一运算符最多只有 2 个操作数的情况下,只要尾部长度 t=h+1 就能保证编码的前 k(1≤k≤编码总长 n)个符号组成一个有效的K表达式。在表达式中可能出现常量系数。由于符号和数字在格式上的差异,在进行遗传操作的时候不便统一处理,因此将表达式中的具体数值分离出来,在出现常量或系数的地方用一符号代替(例如“?”),而将具体数值依次存至一个中。基因编码也相应分为两部分:表达式编码串和数值编码串。其中,数值编码串的长度也是固定的,令 =h(出于保证足够的数字个数。 +1=12和vs=h=11,编码总长为34,那么举例给出一个可能的编码如下: 解码时,从数值编码串中依次选取数值代替表达式中的“?”,数值编码串中多余的数值在遗传操作中起作用。GEP 的遗传操作开始于初始群体的形成。首先定义运算符集合F:{*,/,……}和变量集合P:{xy,z,……},P中变量个数由所求问题而定。根据编码方法,生成包含表达式编码串和数值编码串的基因个体。初始群体中个体应达到一定的数量,比如 个适应度评价在遗传算法中,适应度是描述个体性能的主要指标根据适应度的大小,对个体进行优胜劣汰GEP借鉴自然界适者生存的启示适应度函数第i个基因对应的函数表达式利用第j个样本中的变量数据求得的函数值 代表第i个基因第 j 个样本目标函数为最小问题 其中系数可以是一个合适的输入值,也可以采用迄今为止进化过程中的最大值选择运算遗传算法使用选择运算(或称复制运算)来实现对群体中的个体进行优胜劣汰操作:适应度高的个体被遗传到下一代群体中的概率大;适应度低的个体,被遗传到下一代群体中的概率小。选择操作的任务就是按某种方法从父代群体中选取 一些个体,遗传到下一代群体。选择方法各个被选中的概率与其适应度大小成正比。具体如下: (1)计算出群体中每个个体的适应度,=1,2,… , ,为群体大小;(2)计算出每个个体被遗传到下一代群体中的概率=1,2,… ,为群体大小(3)计算出每个个体的累积概率=1,2,… ,大小[0,1]区间=1,2,… ,;(4)在[0,1]区间内产生一个均匀分布的伪随机数r;(5)若r ≤Qk,则选择个体 k (6)重复(4)、(5)共次。 排序选择对群体中的所有个体按其适应度大小进行排序,基于这个排序来分配各个被选中的概率。其具体操作过程如下 : (1)对群体中的所有个体按其适应度大小进行降序排序;(2)根据具体求解问题,设计一个概率分配表,将各个概率值按上述排列次序分配给各个个体;(3)以各个个体所分配到的概率值作为其遗传到下一代的概率,基于这些概率用赌盘选择法来产生下一代群体 最优个体保留方法当前群体中适应度最高的个体不参与交叉和变异运算,而是用它来替换本代群体中经过交叉 、变异后所产生的适应度最低的个体。该方法可保证迄今为止所得到的最优个体不会被交叉、变异操作所破坏,它是遗传算法收敛性的一个重要保证条件。另一方面,它也容易使得局部最优个体不易被淘汰,从而使算法的全局搜索能力不强。因此,该方法一般与其他选择操作配合使用方可有良好的效果。 随机联赛选择 该方法的基本思想是:每次选取个个体之中适应度最高的个体遗传到下一代群体中:一般情况下,的取值为2。具体操作过程如下:(1)从群体中随机选取个个体进行适应度大小比较,将其中适应度最高的个体遗传到下一代群体中;(2)将上述过程重复次,就可得到下一代群体交叉运算交叉运算是产生新个体的主要方法,是指对两个相互配对的染色体按某种方式相互交换其部分基因,从而形成两个新

文档评论(0)

xjj2017 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档