強化学習.pptVIP

下载本文档

16
0
约3.97千字
约 29页
2016-08-17 发布于海南
举报

強化学習.ppt

強化学習

シミュレーション論 Ⅱ第１２回様々なシミュレーション手法（３）　強化学習前回のレポート解答（１）気温とおでんの売り上げが以下の表のようになった。相関分析をおこない、気温とおでんの売り上げに相関があるかどうか調べよ相関係数 R = -0.9834 データ数が４組の場合、|R| 0.950 だから5％水準で有意であり、|R| = 0.9834とかなり 1に近いため気温とおでんの売上には高い負の相関があるといえる前回のレポート解答（２）次に回帰直線を求めるデータ数 n = 4 で、データの組はそれぞれ a, b は以下の式で求められるただし前回のレポート解答（３）Ｂ～Ｅを求めると前回のレポート解答（４） a, b の式に代入してよって回帰直線の式は Y = -1.13X + 21.59 強化学習強化学習：試行錯誤をくりかえして、よりよい行動方針を獲得する手法状態と行動をセットにして記述し、うまくいった場合に「報酬」、失敗した場合に「罰」を与えることでよりよい行動を獲得するようになる教師データが不要なため、未知の環境への応用が可能ロボットの行動獲得などによく利用される強化学習のしくみ強化学習では学習をおこなう「主体」と「環境」がある主体は環境の状態を観測し、行動を選択する行

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

強化学習.pptVIP