- 1、本文档共21页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Your company slogan 人工神经网络与人机博弈 温文欢 王衎 杨磊 王宇飞 赵静 李娜 廖婷婷 陈芬 黄鹏飞 李浩攀 总目录 生物学的神经网络 1 人工神经网络 2 神经网络的人机博弈应用 3 小实验:井字过三关 4 生物学的神经网络 动物的大脑结构 分为灰色的外层和白色的内层。灰色层只有几毫米厚,其中紧密地压缩着几十亿个被称作神经元的微小细胞。白色层在皮层灰质的下面,占据了皮层的大部分空间,是由神经细胞相互之间的无数连接组成。皮层象核桃一样起皱,这可以把一个很大的表面区域塞进到一个较小的空间里。这与光滑的皮层相比能容纳更多的神经细胞。 人的大脑大约含有1OG (即100亿)个这样的微 小处理单元 生物学的神经网络 神经细胞 神经细胞都长着一根像电线一样的称为轴突(axon)的东西,它的长度有时伸展到几厘米,用来将信号传递给其他的神经细胞。它由一个细胞体、一些树突、和一根可以很长的轴突组成。 神经细胞利用电-化学过程交换信号。输入信号来自另一些神经细胞。这些神经细胞的轴突末梢和本神经细胞的树突相遇形成突触,信号就从树突上的突触进入本细胞。大脑的神经细胞只有两种状态:兴奋和不兴奋。发射信号的强度不变,变化的仅仅是频率。神经细胞把所有从树突上突触进来的信号进行相加,如果全部信号的总和超过某个阀值,就会激发神经细胞进入兴奋状态,这时就会有一个电信号通过轴突发送出去给其他神经细 胞。 神经网络特点 能实现无监督的学习—不存在导师,网络根据外部数据的统计规律来调节系统参数,以使网络输出能反映数据的某种特性。 对损伤有冗余性 —大脑即使有很大一部分受到了损伤,它仍然能够执行复杂的工作。 处理信息的效率极高—神经细胞采用了并行的工作方式,使得大脑能够同时处理大量的数据。 善于归纳推广 —极擅长的事情之一就是模式识别,并能根据已熟悉信息进行归纳推广 。 它是有意识的—这个在人工神经网络中不予讨论。 人工神经网络 模拟大脑的人工神经网络ANN是由许多叫做人工神经细胞(也称人工神经原,或人工神经元)的细小结构模块组成。人工神经细胞就像真实神经细胞的一个简化版,但采用了电子方式来模拟实现。 一个人工神经细胞可以有任意n个输入,n代表总数。可以用下面的数学表达式来代表所有n个输入: ?????x1, x2, x3, x4, x5, ..., xn 同样 n 个权重可表达为: ?????w1, w2, w3, w4, w5 ..., wn 那么激励值就是所有输入与它们对应权重的之乘积之总和。 如下图,网络的每一层神经细胞的输出都向前馈送到了它们的下一层,直到获得整个网络的输出为止。这一种类型的神经网络就叫前馈网络。 网络共有三层(输入层不是神经细胞,神经细胞只有两层)。输入层中的每个输入都馈送到了隐藏层,作为该层每一个神经细胞的输入;然后,从隐藏层的每个神经细胞的输出都连到了它下一层(即输出层)的每一个神经细胞。图中仅仅画了一个隐藏层,作为前馈网络,一般地可以有任意多个隐藏层。 人工神经网络 神经网络的人机博弈应用 人机博弈的重要事件 1988年,“深思”击败丹麦特级大师拉尔森 1989年,每秒思考速度达200万步的“深思” 0 比2不敌卡斯帕罗夫 1993年,“深思”二代击败了丹麦国家队,在与前女子世界冠军小波尔加的对抗中获胜 1996年,性能高于“深思”数百倍的“深蓝” 以2比4负于卡斯帕罗夫 1997年,“更深的蓝” 以3.5比2.5击败了卡斯帕罗夫 2001年,一家德国公司开发的国际象棋软件“更弗里茨”击败了除克拉姆尼克之外的所有排名世界前十位的棋手 2002年10月,“更弗里茨”与克拉姆尼克在巴林进行“人机大战”,双方以4比4战平 2003年1至2月 由两位以色列电脑专家研究出的“更年少者”与卡斯帕罗夫对弈,双方3比3战平。 1997年卡斯帕罗夫与深蓝2的人机大战 2003年卡斯帕罗夫与更年少者的人机大战 神经网络的人机博弈应用 Gerald Tesauro 的西洋双六棋 西洋双陆棋是西方一种状态空间比较大的棋类游戏。1992年,IBM的工程师Gerald Tesauro利用人工神经网络,编写出一款双六棋程序TD-Gammon。在本例中使用的神经网络包含198 个输入节点、 80个隐含节点和1 个输出节点。其中输入节点输入
您可能关注的文档
最近下载
- ACD奥的斯内部资料GECB及GDCB服务器使用.pdf
- 初中七年级地理上册期末试卷(含答案).pdf VIP
- 《工程建设标准强制性条文 电力工程部分 2016版》.docx
- 大学毕业论文-基于pid算法的锅炉恒温控制系统正文.doc VIP
- 南华大学《自动控制原理B》2023-2024学年第一学期期末试卷.doc VIP
- 南华大学《自动控制原理B》2022-2023学年第一学期期末试卷.doc VIP
- 南华大学船山学院《自动控制原理》2021-2022学年第一学期期末试卷.doc VIP
- 金融学(中央财经)中国大学MOOC慕课 章节测验期末考试答案.docx
- 12.2 人生价值贵在奉献(教学课件)-【中职专用】中职思想政治《哲学与人生》同步教学示范课课件+教案(高教版2023·基础模块).pptx VIP
- 2024华医网继续教育心血管病预防与康复题库答案.docx VIP
文档评论(0)