- 1、本文档共100页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
强化学习应用.ppt
* * * * * * * * * * * * * * * * * * * * * * * * Observations: {laser, speech, touchscreen, reminder} State features: robot_location person_location person_status reminder_goal motion_goal user_goal * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 史忠植 强化学习 * Nursing Robot Pearl 史忠植 强化学习 Pearl介绍 Pearl is a prototype nursing robot, providing assistance to both nurses and elderly people. “thinkers” eyes with cameras sonar sensors handlebars wheeled base carrying tray LCD smile/frown * * CogRob2002 workshop 史忠植 强化学习 老年人数 450,000 more nurses needed by 2008 campaign to recruit and retain nurses and other health care providers * * 史忠植 强化学习 Moving things around Enabling use of remote health services Supporting inter-personal communication Calling for help in emergencies Monitoring Rx adherence safety Providing information (TV, weather) Management support of ADLs Reminding to eat, drink, take meds Providing physical assistance Linking the caregiver to resources 机器人助理保健 * * * 史忠植 强化学习 * References Sutton, R.S. and Barto, A.G. (1998). Reinforcement Learning- An Introduction. Hastie, T., Tibshirani, R. and Friedman, J. (2001). The Elements of Statistical Learning-Data Mining, Inference and Prediction. Murphy, S.A. (2003). Optimal Dynamic Treatment Regimes. JRSS-B. Blatt, D., Murphy, S.A. and Zhu, J. (2004). A-Learning for Approximate Planning. Murphy, S.A. (2004). A Generalization Error for Q-Learning. D. P. Bertsekas and J. N. Tsitsiklis (1996). Neuro-Dynamic Programming. 宋志伟, 陈小平, 2003. 仿真机器人足球中的强化学习. 《机器人》, 24(7S):761-766. Joelle Pineau and Sebastian Thrun. High-level robot behavior control using POMDPs. CogRob2002 workshop. * 史忠植 强化学习 * Thank You Intelligence Science / * * * * * * * * * * * * * * * * * * * * * * * * * * * 史忠植 强化学习 * POMDP部分感知马氏决策过程 Rather than observing the state we observe some function of the state. Ob – Observable function a random variable for each
您可能关注的文档
最近下载
- GBT12474-2008 空气中可燃气体爆炸极限测定方法.pdf
- 【四川】2025年中考英语仿真模拟测试题(含答案).docx VIP
- 学堂在线行云流水——工科的中文写作(清华)章节作业答案.docx
- (新教材)粤教版五年级下册科学2.13网上学习:身边的发酵食品课件.pptx VIP
- 《SketchUp三维辅助设计》课件——05 SketchUp基本编辑工具.pptx VIP
- 云天课件-中职《机械基础》第十章-气动传动与液压传动(动画版)(栾学钢、赵玉奇、陈少斌).ppt VIP
- 全国农产品地理标志产品列表.docx VIP
- 《SketchUp三维辅助设计》课件——04 SketchUp基本绘图工具.pptx VIP
- 华为公司战略规划和落地方法之:五看三定工具解析.pptx
- 《SketchUp三维辅助设计》课件——03 SketchUp基本操作方法.pptx VIP
文档评论(0)