- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
平均收益 生活中碰到很多问题,我们都是按照风险(平均损失)最小准则选择最优决策的。其实我们还可以按照平均收益最大准则选择最优决策。 新知学习 收益函数:一般地,对于给定的行动方案d和状态h,用q(d,h)表示行动方案d在状态h下的收益大小,并称q(d,h)为收益函数。 新知学习 例:某农场要决定一块地中选择什么作物,可选择的作物有蔬菜,水果和芝麻。场主多年经验列出了一张表,请你帮助场主做出最优决策。 旱 正常 多雨 0.2 0.7 0.1 蔬菜 1000 4000 7000 水果 2000 5000 3000 芝麻 3000 6000 2000 天气 利润 方案 新知学习 分析:这个决策问题的目标是使获得的收益最大。他所能采取的全部行动方案包括:种植蔬菜、种植水果、种植芝麻。未来的气候包括:旱、正常、多雨。 h1、h2、h3的概率分别为0.2、0.7、0.1。求出每种行动方案的平均收益进行比较。 答案:能采取的全部行动方案包括: d1:种植蔬菜 d2:种植水果 d3:种植芝麻 未来的气候包括: h1:旱 h2:正常 h3:多雨 Q(d1)= q(d1,h1)×P(h1)+ q(d1,h2) ×P(h2) + q(d1,h3)×P(h3) =1000 ×0.2+4000 ×0.7+7000 ×0.1 =3700 新知学习 收益函数可以定义为: q(d1,h1)=1000,q(d1,h2)=4000, q(d1,h3)=7000;q(d2,h1)=2000, q(d2,h2)=5000,q(d2,h3)=3000; q(d3,h1)=3000,q(d3,h2)=6000, q(d3,h3)=2000. Q(d3)= q(d3,h1)×P(h1)+ q(d3,h2) ×P(h2) + q(d3,h3)×P(h3) =3000 ×0.2+6000 ×0.7+2000 ×0.1 =5000 新知学习 Q(d2)= q(d2,h1)×P(h1)+ q(d2,h2) ×P(h2) + q(d2,h3)×P(h3) =2000 ×0.2+5000 ×0.7+3000 ×0.1 =4200 由于Q(d3)> Q(d2)> Q(d1),故行动d3带来的平均收益最大,所以应该选择d3,即“种植芝麻”这种行动方案。 新知练习 1、某市民决定将多余的积蓄用来购买证券,经研究决定买A证券或B证券。他考究得知,A证券在未来市场中良好、一般、差三种情况的概率为0.6、0.2、0.2。B证券在未来市场中良好、一般、差三种情况的概率为0.5、0.2、0.3。然后,这位市民根据过去的经验,得到一个证券表(单位:元),请你帮助这位市民选择最优证券。 良好 一般 差 A 12 4 -6 B 22 6 -20 状态 利润 证券 新知练习 分析:市民的决策目标就是使得买的证券获得最大的收益。他所能采取的全部行动方案包括:购买A证券和购买B证券。未来的市场状态包括:良好、一般和差。 新知练习 h h1 h2 h3 P(d1) 0.6 0.2 0.5 P(d2) 0.5 0.2 0.3 h的分布列列表为: d1:购买A证券 d2:购买B证券 h1:良好 h2:一般 h3:差 答案:市民的行动方案有两种 未来的市场状态有三种: Q(d1)= q(d1,h1)×P(h1)+ q(d1,h2) ×P(h2) + q(d1,h3)×P(h3) =12×0.6+4×0.2-6×0.2 =6.8 新知练习 则收益函数可以表示为: q(d1,h1)=12,q(d1,h2)=6, q(d1,h3)=-6;q(d2,h1)=22, q(d2,h2)=6,q(d2,h3)=-20; 由于Q(d1)> Q(d2),故行动d1带来的平均收益最大,所以应该选择d1,即“购买A证券”。 新知练习 Q(d2)= q(d2,h1)×P(h1)+ q(d2,h2) ×P(h2) + q(d2,h3)×P(h3) =22×0.5+6×0.2-20×0.3 =6.2 新知练习 2、篮球比赛正在激烈进行!小刚突破至篮下有三种选择: 选择一:自己投篮,得两分。 选择二:将球传给小虎,得三分,但是有0.1概率被抢断。 选择三:将球传给小亮,得三分,但是有0.2概率被抢断。 小刚的命中率为0.8,小虎的命中率为0.7,小亮投篮必中。 如果你是小刚,你会如何选择? 新知练习 解析
文档评论(0)