- 1、本文档共150页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
课程名称: 数据挖掘与统计决策 教 师: 廖 芹 Email : maqliao@ 遗传算法的模式定理 P254 5) 七、数据挖掘方法——遗传算法 问题描述 在城市医疗能力评价中,令X1——病床数,X2——医生数,X3——工作人员数,X4——诊所数,X5——死亡率,Y——医疗能力, 若设Xi?[1000,10000],i=1,2,3,X4 ?[10,100], X5 ?[0,0.2],Y ?[0,1], X=(X1,X2,X3,X4,X5) 要求:设计遗传算法,求达到医疗能力最好且总成本最小的X(即Xi的最优组合)? 设计包括: (1)定义医生、病床、工作人员、诊所的成本条件; (2)设计编码、适值函数、选择算子、交叉算子和变异算子; 其中,适应值函数要求设计为一般形式;当输入ai、bi、C、、D时,可以建立不同参数下的适值函数: 软件辅助遗传算法的求解 七、数据挖掘方法——遗传算法 七、数据挖掘方法——遗传算法 为了能够使用Matlab里面的遗传算法工具箱来解决此次问题,需要把Matlab升级到7.10(2012版本)或者以上。 打开Matlab之后,直接的窗口中输入optimtool,然后选择ga,或者直接输入gatool,调用遗传算法工具箱。如下图所示: 界面分3个板块,其中左边和中间的板块是遗传算法参数的设置区域,第三板块是对于各个参数的说明。 在使用遗传算法工具箱之前,需要对之前写好的适应值函数做小小的修改,以使其能应用在遗传算法工具箱里面。 七、数据挖掘方法——遗传算法 利用Matlab的多层感知机的神经网络模型,学习后提取的模型参数如下: 权值3:1.8952 权值2:2.5511 阈值:0.10116 权值1:-0.95112 输出节点y 权值5:2.4553 权值4:2.5387 权值3:3.205 权值2:-0.93835 阈值:0.5038 权值1:2.8084 隐节点3 权值5:0.043026 权值4:-2.7673 权值3:1.6277 权值2:-1.2138 阈值:-0.0020444 权值1:-3.4496 隐节点2 权值5:1.9782 权值4:0.66217 权值3:1.9193 权值2:3.2134 阈值:0.29542 权值1:1.3714 隐节点1 七、数据挖掘方法——遗传算法 适应值函数设计: function y=safeval_tel(x) y=cal1([x(1);x(2);x(3);x(4);x(5)])-cal2([x(2);x(3);x(4)]); 其中x为输入变量,x(i)(i=1,2,3,4,5)为每一维的变量。cal1为医疗能力计算函数,cal2为成本函数,综合适应值为前者-后者,因此医疗能力越大,成本越小,最后的综合适应值就越大。 医疗能力计算函数: function y = cal1(x) w = [1.3714 3.2134 1.9193 0.66217 1.9782 -3.4496 -1.2138 1.6277 -2.7673 0.043026; 2.8084 -0.93835 3.205 2.5387 2.4553]; b = [-0.95112 2.5511 1.8952]; y = w * x + b; for i = 1 : 3 y(i) = 1 / (1 + exp(-y(i))); end B = [0.29542 -0.0020444 0.5038]; T = [0.10116]; y = B * y + T; end 已知成本: 1)医生数(平均1万元/个),工作人 员数(平均0.6万元/个),门诊所数(平均100万/个) 2) 医生数(平均2万元/个),工作人员数(平均1万元/个),门诊所数(平均150万/个) 成本计算函数: (第一种成本) function y = cal2(x) y=(x(1)+0.6*x(2)+100*x(3)+152.4)/304.8; end (第二种成本) function y = cal2(x) y=(2*x(1)+x(2)+150*x(3)+229.5)/459; end 其中成本得分为归一化之后的得分 七、数据挖掘方法——遗传算法 遗传算法—基本概念 补充 七、数据挖掘方法——遗传算法 补充 P242 七、数据挖
文档评论(0)