- 5
- 0
- 约1.4千字
- 约 22页
- 2019-09-12 发布于天津
- 举报
College of Mathematics and Computer Science 基于遗传算法的特征选择 What Why How 什么是特征选择? 就是从一个特征集合中选择一个最优子集。 遗传算法流程图 How 1. 问题编码 对于特征选择问题,问题编码很简单,采用0-1编码即可。 任何一个n元0-1串,都表示问题的一个解。 2. 如何产生下一代 通过选择、交叉、变异三种遗传操作产生下一代,前两种操作每一次都要用的,而第三种则不一定,但没有规则。 选择是用来选择交叉的父本,交叉(模拟有性繁殖)产生新的个体,变异是某一位的变异。 3.如何评价种群的质量 适应度函数设计,对于特征选择问题可采用如下的类别可分离性准则,设计适应度函数。 适应度函数为 需要注意的是这种适应度函数,只适用于连续值数据库的情况。下面如何计算? Iris数据库 选择的特征子集应使类内散度尽可能小,而使类间散度尽可能大. 设xk(i)和xl(j)分别为?i类和?j类中的D维特征向量,?(xk(i) , xk(j))为这两个向量间的距离,则类间平均距离为: 其中,Pi和Pj为先验概率。 通常采用欧氏距离: JD称为各类之间的平均平方距离。 定义 类均值向量为和总均值向量分别为: 和 定义 类间散度矩阵Sb的估计为: 定义 类内散度矩阵Sw的估计为: 其中,?i为类协方差矩阵。 其他需要说
您可能关注的文档
- 基于岗位价值评估的薪酬体系设计讲解学习.ppt
- 基于核心素养的中学物理教学案例的研究的中期汇报学习资料.pptx
- 基于核心素养培育的思想政治课堂教学改革11--17说课材料.ppt
- 基于核心素养英语--教学幻灯片课件.pptx
- 基于美国4C核心素养下的STEM教育(x版)复习课程.pptx
- 基于能力素质模型的培训规划与管理教程文件.ppt
- 基于农产品安全的土壤环境质量基准研究-以Cd和DDT为例备课讲稿.pptx
- 基于山东省17地市面板数据的聚类分析文章电子教案.doc
- 基于上海绿新黑天鹅事 件的内部审计风险的成因及防范研究毕业论文文章资料教程.doc
- 基于数据驱动的系统监控与故障诊断.幻灯片课件.ppt
原创力文档

文档评论(0)