- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于操作条件反射自动机的仿生自主学习方法
第 37卷 第 11期 北 京 工 业 大 学 学 报 Vol_37 No.11
2011年 11月 J0URNALOFBEIJINGUNIVERSITY OFTECHNOLOGY NOV.20l1
基于操作条件反射 自动机的仿生 自主学习方法
阮晓钢,郜 园园,宋洪军
(北京工业大学 电子信息与控制工程学院,北京 100124)
摘 要:提出了基于操作条件反射的仿生 自主学习方法,设计了操作条件反射 自动机 (OCM)的认知模型.与原
来的学习自动机相比,该模型增加了状态取向单元,利用 “反应 一强化”的学习机理,来模拟 自然界生物的 “随机
应变性”.设计了OCM 的递归学习算法 ,用于模拟生物的操作条件反射机制,使其具有仿生的自组织功能,包括
自学习和 自适应功能.通过模拟 Skinner鸽子实验和倒立摆平衡控制实验 ,验证 了该模型具有一定的仿生 自主
学习能力,可用于描述、模拟和设计各种 自组织系统.
关键词 :操作条件反射 自动机 ;仿生 ;自主学习;自组织
中图分类号 :TP18 文献标志码 :A 文章编号 :0254—0037(2011)11—1631—07
1938年,美国Harvard大学心理学教授 Skinner在其著作 《TheBehaviorofOrganisms))中提出了 “操作
条件反射”(operantconditioning,Oc)的概念 ,并 由此创立了Skinner操作条件反射理论.人们也随之开始
关注模拟操作条件反射的认知模型研究.美国卡内基 ·梅隆大学 (CMU)机器人学研究所和认知神经生理
学基础研究中心,自20世纪 90年代中期开始进行 了一项持续时间较长 的关于机器人控制的研究计划
(TheSkinnerbotsProject),主要研究关于Skinner的操作条件反射的计算理论和计算模型,这种模型能复
制动物 (如 鼠、狗、鸽子等)学习操作或控制的实验;然后,在 自主机器人上实现这种模型,使其成为可训练
的机械(trainablemechanism)1-4].之后,Skinnerbots的研究转向SonyAIBO(一种机器狗),Touretzky等人
进一步发展了Pavlov经典条件反射理论与 Skinner的OC理论相结合的计算理论和计算模型,这类模型能
处理机器人所遇到的多种知识获取和学习问题,而 SonyAIBO机器狗就是这类模型的实验研究平台 .
1997年 ,美 国波士顿大学 Neurobotics实验室的Gaudiano等针对一个实际的轮式机器人 Khepera的导
航问题,建立了Pavlov理论与 Skinner理论相结合的神经计算模型,Khepera不需要任何先验知识和教师
信号 ,即可在巡航过程中学习规避障碍 .
2005年,日本早稻 田大学机械工程系机器人研究小组 Itoh等为人性化机器人 (humanoidrobot)设计 了
一 种新的行为模型,发展了Hull行为理论,作为 Sinner操作条件反射理论的数学模型.这一模型在 WE一
4RII机器人上得以实现,实验显示,基于OC操作条件反射模型,WE一4RII能在其预先制定的行为列表范
围内,自主地选择合适特定情景的行为模式 ¨.
从上述研究中可以看 出,OC模型已越来越受到人们关注,并且在一定程度上实现了生物体复杂的行
为认知 ,但未能很好地体现生物体 自组织、自学习的操作行为.因此 ,这里提 出一种操作条件反射 自动机
的模型.该 自动机是一种基于操作条件反射的仿生学习 自动机.学习 自动机 (LA)的研究 已比较成熟 ,最
早是由Narendra等在 1974年提出口 ,LA能适应未知的随机环境并做 出行为决策 ,它有有限个行为集合
且每个行为都有其对应 的回报概率值 ,通过与环境的相互作用进行学习从而选择最佳行为.1985年,
Thathachar等提出一种预估 自动机模型,该模型比较简单,在仿真实验中收敛速度 比较快 ¨.1990年,
Oommen等采用追踪算法提出一种 自动机的模型,提高了自动机的收敛速度” .1992年,Lanctbt等提出
收稿 日期 :2009—09—17.
基金项 目:国家 自然科学基金资助项 目;国家 “863计划”资助项 目 (2007AA04Z
您可能关注的文档
- 从碱性含钒溶液中萃取钒的试验研究-有色金属冶炼部分.DOC
- 仪器技术指标自动凯氏定氮仪1台1货物名称凯氏定氮仪2.DOC
- 企业可用物质非食用物质易滥用物质允许用物质汇总表.DOC
- 企业参访心得经济二B-中正大学经济学系.DOC
- 企业无形资产管理的概述西安培华学院.doc
- 传质与分离课程考试试卷A卷.DOC
- 低热量食用油项目可行性报告.DOC
- 低温钢压力容器焊接规程-铝道网.DOC
- 住院医师规范化培训临床技能竞赛范围非手术类别一.DOC
- 体外诊断试剂校准品-医疗器械技术审评中心.DOC
- 2025至2030中国移动治疗台行业发展研究与产业战略规划分析评估报告.docx
- 2025至2030链激酶行业细分市场及应用领域与趋势展望研究报告.docx
- 2025至2030爆炸物探测扫描仪行业市场占有率及有效策略与实施路径评估报告.docx
- 2025至2030四川省智能制造行业细分市场及应用领域与趋势展望研究报告.docx
- 2026届高三二轮复习试题政治大单元突破练1生产资料所有制与分配制度含解析.docx
- 2026届高三二轮复习试题政治大单元突破练16哲学基本思想与辩证唯物论含解析.docx
- 2026届高三二轮复习试题政治大单元突破练2社会主义市场经济体制含解析.docx
- 浙江省衢州市五校联盟2025-2026学年高二上学期期中联考技术试题-高中信息技术含解析.docx
- 浙江省金丽衢十二校2026届高三上学期11月联考政治试题含解析.docx
- 2026届高三二轮复习试题政治大单元突破练7领导力量:中国共产党的领导含解析.docx
原创力文档


文档评论(0)