我搜索,所以我存在-AndreasWeigend.docVIP

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
我搜索,所以我存在-AndreasWeigend

“我搜,故我在” Version used at Tsinghua March 2006 作为亚马逊公司(A)的前任首席科学家和世界顶尖级的数据挖掘专家,韦思岸教授(Andreas Weigend)博士无论其本人,还是其观点,均倍受世人尊崇。要是你错过了他在M2004(世界上最大规模的数据挖掘会议)上的那次演讲,那么,现在,你肯定不想再次与他失之交臂。在下面这篇文章中(2004年10月4日发表于德国期刊《焦点》(Focus),经批准重印),韦思岸博士向我们阐述了如何利用数据来准确地预测消费者行为。 焦点:所有人都一样吗? 韦思岸博士:不,当然不一样。人都是不同的个体,而每个个体都有其非常独特之处。这一点可以从人们在互联网世界中留下的这样那样的痕迹中反映出来。但是,令人吃惊的是,人们的行为却经常能够被准确地预测出来。而这恰恰正是我所从事的这一行中一个最根本的矛盾。 焦点:直到今年上半年以前,您一直担任亚马逊的首席科学家。我们都知道亚马逊以准确推荐个人产品而闻名。您现在正在建议一批拥有丰富客户数据的公司充分利用其数据,这其中包括两家大型的在线约会网站:和。到底是什么东西让人们即使在像文学品味和伴侣挑选这样困难的事项上都具有这么大的可预测性呢? 韦思岸博士:大家都知道我们在做出决策时都要经过深思熟虑——不管是买本书也罢,还是找个同伴也罢。然而,大多数事情要比他们自己想象的容易预测的多。人们遇到某种情形就会做出某种反应。如果你长期地观察消费者,就会发现有很多规律可循。例如,消费者的信息搜索行为就有很大的规律性。当然,人们的短期行为比长期行为更容易被预测。 焦点:能举个例子吗? 韦思岸博士:假如去年你只买了有关沙皇的各种传记,那么可以推测你下次到书店,很可能还会做出同样的选择。要是有这方面的新书出版了,书店就可以利用这个判断来提醒你。然而,在很多情况中你当前的行为,比方说你现在正在看什么,就是一种具有高度关联性的信息源,这些信息的综合就构成了某种判断的基础。在这种情况下,商家的判断是以所有消费者的购买行为作为基础而给你推荐的,至于和你过去的行为则没有什么联系。亚马逊公司管理着一个庞大的产品系列,在这个系列中,数百万种产品互相关联,每个产品条目实际上都记录着与该单元相对应的产品的购买人数。这就是在你点击目标时商家向你提出推荐的基础。顺便说一下,因为这种算法并没有考虑你过去的购买行为,因此,即使你匿名登录网站,用这种方法推荐产品也是十分准确的。 焦点:通过简单分析我目前的行为,您真能预测出我下一步的行动吗? 韦思岸博士:当然,还相当准确。但是更重要的是,利用这些信息,我不仅能预测到你的下一步行为,还能直接引导你的行动。在整个20世纪90年代,我都在为华尔街的一些大公司做顾问。在那些公司里,建立一个可靠的预测模型,就算完成了大部分工作。为什么这样讲呢?因为相应的行动很简单——价格上涨就买,价格下跌就卖(当然,这没有把风险和投资组合因素考虑在内)。在电子商务中,做出正确的预测只是第一步,这包括在成千上万种商品中,应该把哪些产品放在页面上?放在页面上哪个地方?以多少价钱出售?等等。做出预测后,接下来确定最佳的行动才是真正难办的事情。为什么呢?因为就展示商品过程而言,系统的反应还可以由你来控制;而一旦涉及到付款,除非你愿意损失大量金钱,否则你没有办法影响系统。 焦点:回过头来再谈一谈网上购物。您能举个根据你的预测来决定在网上展示什么样的产品的例子吗? 韦思岸博士:这需要仔细考虑一下用户的状态。他是匆匆忙忙的呢,还是在无所事事消磨时光?当然,还有许多其他有趣的特征,要知道我们都是同时处在多种状态之中的,我们都会对很多事情感兴趣。比如,当你想给你的母亲买件礼物时,你更愿意根据需要选择一双冬季的保暖袜子,而不是你在网站上留下的互动记录。但是,这个信息却可以被利用来预测你下一步要做什么,在这个例子中,网站可以据你的操作做出反应,向你出示那些可能会符合你当前状态的产品。这个假设源自于我上面提到的产品购买记录假设。累积汇总而来的这些消费者数据相当精确,因为每天都有数百万消费者通过他们的购买行为在修正这些数据。 焦点:在我还没有点击之前,您怎么能知道我是想给母亲买袜子呢,还是为我的蒂丽阿姨买火鸡的涂油器呢? 韦思岸博士:这当然要取决于我们有什么样的数据。也正因为如此,开辟新数据源要比改进算法重要得多。网站通常都知道你以前曾浏览过哪些站点,例如,你登录了一家编织技术网站,点击其上面的一个链接,这个链接把你带到了亚马逊网站,那么亚马逊就知道你是从哪家网站来的。你是借助关键词通过搜索引擎登录网站,还是通过购物比较引擎登录网站,还是直接在浏览器上输入“”登录网站,你采用不同登录方式,说明你的心态可能就不一样。你是不停地点击,还是在搜索框中直接

您可能关注的文档

文档评论(0)

dlhss + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档