[演讲全文]李彦宏详解框计算.docVIP

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
[演讲全文]李彦宏详解框计算 李彦宏:各位来宾、各位合作伙伴和媒体的朋友大家上午好!欢迎来到2010百度世界大会。我想来到这样一个会场,很多人都非常容易想起一年前的百度世界大会。在一年前,百度首次对外公布了有关框计算的理念和畅想。如果说一年前的框计算推出的时候 还只是一个理念,是一个畅想,甚至给人一点科幻的味道,今天我们的框计算已经迈出了结结实实的一大步。我想利用这个机会给大家展示和汇报一下框计算在过去 一年中所取得的进展。 首先我们来看一下框计算的技术架构,这张图也是我去年给大家展 示过的,从去年到今年整个的架构是没有任何的变化的,用户有各种各样的需求,通过一个简单的框进入到框计算的体系当中。在框计算的另外一段我们通过一些开 放的接口让各种各样的应用、内容、数据很容易地提交上来,中间这一部分我们称之为需求分析。这里面的技术含量是非常高的,它包括了语义的分析、行为的分 析、智能的人机交互和海量的计算。这个事情为什么很难呢?因为人的表达方式是多种多样的,它表达出来的用词、用语和实际的需求通常是有差距的。而计算在这 方面通常是比较少的,一般来说既使是你表达清楚了它也不能真正地理解清楚。所以要把用户的需求精确地翻译成机器所需要的应用,这里面所需要做的工作是非常 多的。 举一个例子,比如说行为分析,就是根据用户在百度或者说在其他的网站上的使用 行为记录了他大量的点击行为,每一个用户从进来到出去或者到需求满足所做的每一个动作在统计意义上进行分析,通过机器学习的手法提升下一次同类型满足的程 度,甚至是个性化的程度。仅仅机器学习的系统,就是一个非常高科技的系统。我们需要针对上十亿的特征进行训练,这块的开发花了很多的精力。语义分析搞人文 职能的人都了解是非常难的一部分。智能的人机交互是海量的搜索引擎开始做的事情,但互联网发展到今天,搜索引擎已经是高科技领域最具技术含量的产业。所 以,框计算集合了这四种技术应用才能对需求进行分析,分析之后对平台进行分发。 不管 是内容、数据还是应用,通过开放的接口就可以进入到框计算的体系也可以很好地满足用户的需求,下面我给大家展示一下框计算的最新进展。这是一个比较炫的演 示,大家可以看到这个框里面可以做各种各样的事情,无论是天气还是图片的欣赏等格式各样的应用。我给大家一一地解释一下。比如说有关出行的东西我们称之为 框出行。大家很容易想到的就是天气如何,通过一个检索词——天气就可以得到今天、明天、后天、大后天的天气预报,非常地直观和清晰,这就是通过百度的开放 平台提交的结果。这个结果是数据类型的,是相对比较确定答案的。所以我们认为没有必要让用户点击一个链接上网站上去,在这里用户的需求就得到了满足了。 大 家注意到,这个检索词是“天气”两个字,那么系统怎么知道它是找北京的天气预报,怎么知道时间的呢?当用户输入关键词的时候有两个东西是缺少的、是没有输 入的,一个是用户目前所在的位置,第二个是用户输入这个关键词的时间也没有输入,而这两个因素对分析用户的需求是有帮助的。我们根据用户来自的城市和用户 输入关键词的时间判断出来他要的是北京市的天气预报,所以就展现出了这样的结果。换一个说法行不行呢?也是可以的。如果你输入的不是天气而是天气预报,而 是今天的天气怎样,今天天气如何,今天的天气预报等等,有关用户天气方面的需求可能有好几百种的表达方式。每一种大方式代表的都是同样的需求,在这种情况 下我们的需求分析需要能够搞清楚用户的表达和实际需求之间的关系,把它规划到同样的一类数据集上才能展示出同样的答案。这就是为什么数据分析的技术含量是 非常高的。 过去计算机产业、计算机科学研 究了很长的时间。一般来说只有在特定的数据集的情况下,才能比较准确地理解人的自然语言。而搜索引擎不是一个特定的环境,用户的需求都有不同的方式。在这 种情况下传统的计算机科学认为这是无能为力的,是不能解决用户的需求的。随着框计算的诞生,虽然越来越多的人依赖我们的搜索框获得他们想要的信息和服务, 在积累的大量数据的情况下,通过框计算各种各样的技术的分析,就可以很好地满足用户各种各样的需求。 除 了天气之外,北京的朋友可能还面临一个问题就是出行的时候开车,不知道每天自己的车能上路哪天不能上路。有时候我听说智商低于100的人就没有必要在北京 开车了。有了框计算这个东西事情就简单了很多。比如说你输入的词就是今日限行,那么就可以出现每一个时间段的限行车号,而且这个是来自于北京市交管局的, 是最权威的结果。对用户来说他只要知道如何表达,只要想到要表达需求,就要迅速地得到最直接、最权威的答案。再走远一点,比如说需要坐火车、坐飞机,同样 我们可以通过框计算的形式来展现给用户所需要的东西。比如说要从北京到上海去,这里我们立刻展示出了一天中全部15趟列车和票价的情况。头5趟结

文档评论(0)

82393aa + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档