人工智能与信息社会课件:603试错式学习.pdf 10页

  • 0
  • 0
  • 0
  • 约1.01千字
  • 2020-08-13 发布

人工智能与信息社会课件:603试错式学习.pdf

文档工具:
    1. 1、本文档共10页,可阅读全部内容。
    2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
    3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
    4. 文档侵权举报电话:19940600175。
    人工智能与信息社会 基于神经网络的智能系统II:试错式学习 陈斌北京大学gischen@pku.edu.cn 爱德华·桑代克 〉 美国心理学家 〉 现代教育心理学之父 〉 心理学行为主义的代 表人物之一 〉 提出试错式学习理论 北京大学地球与空间科学学院/ 陈斌/2018 机关盒子(puzzle box) 〉 将饿猫关入此笼中,笼中放一条鱼,饿猫急 于冲出笼门去吃笼外鱼,但是要想打开笼门, 饿猫必须一气完成若干个机关。 北京大学地球与空间科学学院/ 陈斌/2018 效果律(law of effect) 〉 紧接着有利后果的行为更有可能再次 发生。 被老师称赞的工作或行为,你会继续保持。 〉 不良后果的行为不太可能再次发生。 如果你上课迟到并错过重要内容,之后就会 吸取教训。 北京大学地球与空间科学学院/ 陈斌/2018 试错式学习(trail and error) 〉 猫的学习是经过多次的试误,由刺激情境与 正确反应之间形成的联结所构成的。 〉 人的学习的过程也是一种渐进的尝试错误的 过程。在这个过程中,无关的错误的反应逐 渐减少,而正确的反应最终形成。 北京大学地球与空间科学学院/ 陈斌/2018 强化学习(reinforcement learning) 〉 使得计算机能够像人一样通过不断试 错式学习,完全自主掌握一项技能 〉 不需要借鉴人类的经验 〉 具有发展强人工智能潜力 北京大学地球与空间科学学院/ 陈斌/2018 Alpha Zero 〉 利用试错式学习思想,自己跟自己不 断对弈来提升水平 〉 用这种通用的学习方式,在围棋、国 际象棋、日本将棋等多个领域超越人 类水平 北京大学地球与空间科学学院/ 陈斌/2018 Flappy Bird 〉 从零学习Flappy Bird 北京大学地球与空间科学学院/ 陈斌/2018 Flappy Bird 〉 尝试10万次后,跨过第一根水管 北京大学地球与空间科学学院/ 陈斌/2018 Flappy Bird 〉 尝试150万次后,表现较高水平 北京大学地球与空间科学学院/ 陈斌/2018

    文档评论(0)

    • 内容提供方:woxiangang
    • 审核时间:2020-08-13
    • 审核编号:6141043013002231

    相似文档