嘘,机器已经能读懂你言外之意.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
嘘,机器已经能读懂你言外之意

嘘,机器已经能读懂你言外之意   想知道德国和阿根廷哪支球队的中国球迷更多?来看看门户网站的投票结果吧,十万人投票,参与的人可真不少。   但是,真正关心两支球队的球迷数量远超于此:巴西世界杯期间,仅仅在社交类网站中,每天就有超过1.2亿人在讨论比赛、讨论自己喜欢的球队,新浪微博中的相关发言甚至超过十亿次。十万样本,只不过是千分之一而已。看到这里,你还相信投票结果吗?   是时候放弃“来呀来呀,来投票嘛”的守株待兔方针,转而“主动出击”了。   不靠投票,而是抓取球迷们的发言,通过自然语意分析来获取他们内心最真实的想法,这就是IBM大数据分析的做法。世界杯半决赛开始前,IBM已经用这种方法分析出了中国球迷对四强的支持率:德国第一、阿根廷第二、荷兰第三、巴西第四,与最终的四强排名惊人地一致。   解读球迷到底支持哪支球队的关键,是让机器??读懂”人类的语言,并从中分辨出“喜爱”、“厌恶”、“无感”甚至“反讽”等复杂的人类情绪―尤其在网络世界中,很少有人会直白示爱“我爱德国”,更多人会说“壮哉我大德意志!” 机器“聪明过人”就等于“会思考”吗   事实上,早在1950年就有人提出了这样的问题:计算机能像人类一样思考吗?这个人叫阿兰?图灵,被后人尊称为“人工智能之父”。   之后的十年里,一系列堪称“神奇”的机器诞生了,它们中有些可以解决代数应用题、有些能证明几何定理、有些可以学习和使用英语……这些如今计算机必备的基本功能,让当时的人们叹为观止。   随着技术的不断发展,一些以“人工智能”为卖点的计算机成为媒体上的明星,其中最具知名度的无疑是“深蓝”(Deep Blue)和“沃森”(Watson)。前者于1997年在国际象棋比赛中战胜了世界冠军卡斯帕罗夫,后者在2011年参加美国智力问答节目《危险边缘》(类似于央视《开心辞典》),接连打败最高奖得主和74场连胜纪录保持者,赢得了100万美元的奖金。这两个计算机系统都是由IBM开发的。   深蓝、沃森,这些战胜不同领域里最优秀的人类的机器,被人们视为实现科幻故事的里程碑―但一个本质问题是,它们真的会“思考”吗?   答案是否定的。“这些成就的取得并不是因为范式上的革命,它们仍然是工程技术的复杂应用,只不过现在的计算机性能已经今非昔比了。”谷歌技术总监雷?库兹韦尔如此评论,他曾被比尔?盖茨称为“我所知道的在预测人工智能领域最厉害的人”。   “深蓝”的成功,完全凭借着蛮横的计算能力。每走一步棋,它都能可以计算六个甚至更多回合之后的局势。运用预设的快速评估程序,它最多能在一秒钟之内计算3.3亿个不同棋局的走势,然后从中选择能带来最高分数的方案。相比之下,世界冠军卡斯帕罗夫每下一步棋前,最多只能评估几十个。   而“沃森”就不一样了,它背后的核心技术,是一种被称为“DeepQA”的算法。它能够用1000多个自然语言处理、机器学习和推理的算法来产生和评价初始答案,然后再从数据中搜索和收集相关的支持信息,以计算初始答案的确信度,并用确信度对初始答案进行排序,最终给出一个最优的答案。从表面上看起来,它就有了初级的“思考”能力。凭借这个能力,它才成为那次比赛的冠军。 也就是说,“尤金”的成功,某种程度上是利用了人类的固有心理:我们总认为自己是一种充满了Bug的生物,就像苏中说的那样,“机器是那么准确,但人会犯错误”。 机器破译人类情感的初级成功示范   三年之后,这次对社交媒体上普通人发言的大规模解读,正是IBM突破“范式”的新尝试。不同于模式化的棋局和问答节目中的标准答案,人类语言要复杂得多。   “就像美国人学中文,几年以后或许可以进行日常交流,但让他看小品,他不见得能够笑得出来。因为语言后面有很多文化和知识的积累,这是更难的境界。”IBM中国研究院信息分析研究部研发总监苏中说。   这已非扩充数据库和提高运算的速度就能解决的―棋局库和题库再大,也是有容量边界的,而语言和文化却没有。解决方案是让机器自己掌握学习的技能:“我们会标注一些样本,比如‘梅西’是一个人名,‘球星’是一种身份,代表人名和身份的词语出现在语言结构中的特征是不一样的,我们要从中找到一些内在规律―其中可能包含着几十种特征,然后构建一个模型,让机器来学习。”苏中向壹读记者介绍。   SoftLayer大型数据中心的运力支持配合IBM强大的云计算能力,为这种不断扩展的学习能力提供了基础。整套系统会在庞大而不断动态更新的社交数据流中抓取所有有用的信息,并且不断进行实时的分析。   解读语言之后,更大的挑战与野心是“读懂”这些发言背后活生生的人。IBM的“大数据情感挖掘技术”可以告诉你,梅西的球迷低调、敏感、理性,以宅男宅女居多;C罗的球迷则不乏女王范儿、有气场、爱热闹;即便是被贴上“咬人”标签的苏亚

文档评论(0)

fangsheke66 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档