沃森-走下竞技场 走上合作台.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
沃森-走下竞技场 走上合作台

沃森:走下竞技场 走上合作台从“人工智能”这一概念被提出那天起,人们就不断在这一领域钻研,并发展出众多理论,而IBM的“沃森”与人类同台竞技并获得胜利,更成为人工智能领域具有里程碑意义的事件,对“沃森”来说,它的最终使命并不是与人类对决,而是服务人类,服务社会,成为人类的合作者。 保守者认为:人类是主宰一切的核心,作为智能机的“沃森”在判断问题时有很高的准确率,即使达到95%以上,在人类做出重要决定时,也不会把决定权交给“沃森”,因为做出决定的应该是人类而不是机器;激进者认为:“沃森”的到来,揭示着人工智能时代快速来临,不久就会在每个角落遍布各式各样的智能机,如机器人、汽车等,它们甚至会说话和买东西。 暂时抛开这些言辞,要想进一步地了解“沃森”,知道它是如何理解人类语言,分析问题的意思,如何从海量知识中快速选出正确答案,这背后又隐藏着何种技术支持等。在2012 IBM软件技术峰会上,IBM沃森研究中心研究成员王敞为我们揭开了谜底。 “沃森”不仅是第二个深蓝 去年西方的情人节,这个看起来冰冷的家伙“沃森”抢尽情人们的风头,让IT客为之疯狂。在美国著名知识竞赛《危险边缘》中,它击败肯·詹宁斯和布拉德·鲁特两位该节目历史上最成功的选手,成为冠军,比赛情况精彩绝伦,“沃森”在第一、二轮几乎抢答近90%题目,第三轮抢答逾60%,答对率逾95%。它的表现不禁要让人夸赞:“这个家伙真酷。” 但它是第二个深蓝吗?一台十五年前战胜国际象棋大师卡斯帕罗夫的计算机?应该说它比深蓝更复杂,因为国际象棋定义明确,主要涉及数学运算,深蓝作为一台拥有强大推理能力和计算能力的计算机,可以轻易判别每一个游戏状态及相应步骤,它是人类数学能力的体现。 而“沃森”在人工智能上又迈出了一步,它一方面分析大量数据,并以极快的速度找到问题的答案,另一方面则能够辨别人类口语和书面语言的差别,即“沃森”在快速处理非结构化数据,包括语言、知识方面取得的突破性进展。例如:Jack Welch就职于GE,用表格一栏表示人物,一栏表示公司,计算机可容易获得答案,但人类的知识是一种自然语言的陈述:如果领导才能是一种艺术,那么Jack Welch在任职GE期间,已经证明了他是一个艺术上的大师。这种知识既表述在问题里又表述在知识里,更难处理。 而《危险边缘》最精彩的地方正在于游戏里的问题包罗万象,几乎涵盖了人类文明的所有领域。因此,“沃森”必须满足开放领域问题回答的要求。它包含两方面意思,第一:这个问题可以以任何形式来问;第二:一个问题涵盖的内容是各个方面的。所以,“沃森”不仅要理解人类语言的二义性、上下相关性,引申意等特点,还需要一个足够大的搜索空间,查找不同形式的表述。 由此“沃森”被设定的目标是:不仅要产生精准的答案,并同时给出每一个答案的确信度,还要为答案提供事实支持,而整个交付的速度要快,因为据研究:超过三秒人类就认为等待的时间过长,影响体验效果。 不能不说的秘密 要让“沃森”达到这些“苛刻”的目标,它就需要拥有复杂的算法,以“听懂”问题的意思,并需要大量数据支持来搜索问题的答案,最后需要引入并行计算的能力加快运算速度。而支持“沃森”的核心技术Deep Question Answer(深度问题回答),就是一个大规模、并行的、基于统计事实的一个体系结构,里面包含了自然语言处理、信息攫取、机器学习推理等很多模块。 它的运作流程是:当一个问题提出后,“沃森”需要分析问题的语法结构,找出关键字及关键字之间的重要程度,确定问题核心,如:一个问题问的是一个地方,Place一词就会用黄线来标注,并进入搜索环节,其流程是从关键字出发,并行地在大量的数据源上搜索相关文档、段落,通过沃森有超过十种的算法,搜集到200-300个可能的答案;下一步进入支持信息搜索,沃森将初始答案带回到问题中替换,然后重新在数据库中搜索,这次搜索主要是针对问题上下文关系定位;最后通过机器学习模型,对收集的结果重新排序,通常正确的结果会被排在第一位反馈给用户。 这是一个看似简单,运作复杂的过程,因为问题以自然语言形式存在,真正理解需要不少推理。如问题:当“60分钟”首演的时候,这个人是美国总统,“沃森”会判断“60分钟”是一个电视节目,但要理解问题的核心就要进行句子分解。“沃森”先确定首演时间,沃森经过对数据库的搜索知道是1968年,此问题就变成了1968年谁是美国总统,然后再次搜索给出正确的答案。(见图一) 同样,知识也以这种非结构化的形式存在,要把知识匹配到问题上也很复杂。如:“安菲他酮对这种类型的神经疾病是一种禁忌”,知识库中会搜索到“有这种病的人士不可吃安菲他酮,因为这种药用量过大会提高疾病发作可能性”,人可以轻易判断二者的统一,但对“沃森”却很难,因为问题里的关

文档评论(0)

linsspace + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档