- 1、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。。
- 2、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
- 3、文档侵权举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第十章马尔科夫决策过程
选择题
AB
B(修改D:状态空间)
C
C
二、判断题
(1)√
(2)×
(3)√
(4)×
√
三、计算题
1.(修改:如果投资y元,投资者将在周期末时以概率?q?收回?1.3y?元;以概率?1-q?收回?0.8y
马尔科夫决策模型
状态空间:状态定义为?(k,w),其中?k?表示剩余投资周期数(k=0,1,…,N),
行动空间:在状态?(k,w)?下,若投资机会出现(概率?p=0.6),则行动为选择投资额?y,满足?0≤
转移概率与报酬:
若投资机会出现且投资?y:
以概率?q:周期末资金变为?w-y+1.3
以概率?1-q:周期末资金变为?w-y
若
原创力文档


文档评论(0)