本田机器人专利JPA_2010134907.pdfVIP

  • 0
  • 0
  • 约2.22万字
  • 约 13页
  • 2026-03-12 发布于浙江
  • 举报

(57)【要約】

【課題】エージェントが複雑な動作を伴うタスクを実行

するための行動方策を学習することができる強化学習シ

ステムを提供する。

【解決手段】本発明の強化学習システム1によれば、環

境から得られる第1報酬r(t)に応じて定まる、第1

1

学習器121による学習結果としての第1価値関数V1

の時間微分である第1価値勾配関数dV/dtの値が

1

第2学習器122による学習、すなわち、第2報酬r(

2

t)の評価に際して活用され、第2報酬r(t)に基づい10

2

てロボットRがタスクを実行するために採るべき行動方

策が決定される。

【選択図】図3

-1-

(2)

【特許請求の範囲】

【請求項1】

エージェントがタスクを実行するための行動方策を学習するための強化学

文档评论(0)

1亿VIP精品文档

相关文档