- 1、本文档共13页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
分析:阿里的野心:大数据搬家记
论文类别:计算机?-?互联网研究上传时间:2014/5/18?12:47:00论文作者:未知
?
(中讯)作为中国最大的电商集团,阿里巴巴一直善于自省自查。大数据革命的旋风吹到中国,让阿里巴巴得以机会发现自己脚下土地的松动。按照“数据基础决定上层建筑”的逻辑,阿里巴巴祭出一系列数据迁移和优化项目——重塑阿里电商生态系统的生命之树正破土生发。然而,“釜底抽薪”般的大动作可是需要拿出十万分的谨慎和耐心……
高空任务
自曝其短、奋起补课的事儿还是静悄悄地进行。
当摄像师不断变换机位寻找最佳视角拍摄时,潘宝坤有点愤怒了。“你们出去!别拍了!等我们做好再回来!”他吼道。
这一幕发生在1月13日晚,在阿里巴巴杭州西溪园区,一个被称为“DNA项目”的秘密计划正进入最关键的时刻。为了记录关键的场景,阿里专门安排了摄像师跟拍了整个项目的关键环节。偏偏在这个时候,技术后台的代码出了点状况,人人都急出一身冷汗。潘宝坤是当晚技术团队的一员。
DNA项目的核心是阿里C2C和B2C两大电商交易平台淘宝、天猫对商品SKU(商品统一编号)的底层技术架构更新。它在天猫对商品类目信息重新梳理的“达尔文计划”的基础上延展而来。如果说达尔文计划是一颗苹果,DNA项目则是一棵苹果树,是阿里电商生态系统的生命之树。阿里集团IPO代号不是叫“阿凡达”(Avatar)吗?如果不做达尔文计划和DNA项目,它是不可能成为智慧星球的,马云的外号“外星人”也将名不符实。
大数据(Big?Data)革命在美国有几种典型表现:亚马逊有个性化搜索A9,A即算法(Algorithms)的缩写。Netflix有76897种电影分类,内部叫“量子论”、“微标签”。Facebook有新闻收集系统。潘多拉电台有音乐基因工程。算法是一种神奇的掌握人类消费行为和内心活动的系统,如何将人工分类与机器智能推荐相结合,一直是互联网顶级之战。
简单理解,每个超市都有很多货架,商品分门别类摆放,如果标签混乱、指向不清,会影响销售效率和购物体验。而作为中国最大的网上商店,淘宝从2004年5月诞生起,平台上的每一款商品都有一个特定数字代码,2008年在???宝内部培育的天猫延续了这种技术架构,十年积累,阿里电商体系里的商品已经超过了20亿。与此同时,商品信息的混乱、冗余、不规范越来越明显。
一个典型的例子:在苹果公司尚未推出iPhone?5c之前,淘宝上居然有人卖绿色版iPhone,“这让人哭笑不得,伤害了淘宝系多年建立起来的信任度。”阿里巴巴共享事业群副总裁王曦若对记者说。
与美国的eBay、亚马逊相比,淘宝的商品类目基础架构和分类管理不是一开始就标准化的,部分SKU的属性值(如规格、型号、颜色、尺码等)可以由卖家自定义编辑,难免会乱七八糟、混淆用户、甚至发生SKU作弊行为(比如将常规商品和配件辅料、瑕疵品等放在一个宝贝链接里出售)。
对于淘宝、天猫来说,商品信息数据系统就像基因之于细胞那么重要,它决定着所有线上交易的进化程度:如果类目规范整齐,交易就简单快捷高效,进而推动自我革新;如果系统杂乱无章,玩不了算法和个性化,影响用户体验,甚至给阿里自身拖后腿。今年3月,马云内部邮件称:云和端(Cloud?+App)将是未来移动互联网的关键,阿里十年的目标是建立DT(Data?Technology),数据时代中国商业发展的基础设施。
王曦若将阿里从达尔文计划到DNA项目的最后一步操作称为“在飞行着的飞机上换引擎”,来形容重整商品类目的风险之高和压力之大。她是DNA项目的总负责人,带领一个近百人的团队。
整个项目的关键是底层后台的数据迁移,他们需要将阿里商品信息开发团队做好的全新模型,链接到无时无刻不在使用的淘宝、天猫平台上。而所有这一切,得稳定平滑过渡,不能惊扰卖家和用户。
商品信息“进化”
瘦死的骆驼比马大。阿里后台“病了”,商品类目信息出现了“病菌”,但它仍然是中国最大的电商平台,以沃尔玛+亚马逊的模式,以电商、金融和数据平台在中国经济扮演着重要的角色。
阿里用来整理和存储商品信息的系统是一个树状结构,在内部叫“类目”。作为第三方交易平台,阿里把商品分成70多个大类,在每一个大类下分出很多子类目,子类目下又有一层层的分类。就像一颗枝繁叶茂的大树,在树干分出很多枝桠后,叶子已经难以计数。
没人否认这套系统的重要性,但即便在阿里内部,对它有了解的人也不多,因为它在技术底层,不直接影响前端交易,不像阿里每年双11的创纪录销售额那样吸引普通人的目光。
每年双11交易额都刷新纪录的天猫,是阿里集团最先推行“达尔文进化论”的部门。2012年5月,天猫更名刚刚4个多月,就被发现有了“病症”。技术人员通过后台看到,越来越多
您可能关注的文档
最近下载
- 电阻焊的原理.ppt VIP
- 机械设计与创新 三相交流异步电动机的选型原则步骤及实例 【课件】任务6.1.1三相交流异步电动机的选型原则步骤及实例.pptx VIP
- 一建【建筑】口袋里的建造师-周超【完全版】.pdf VIP
- 全身型幼年特发性关节炎及合并巨噬细胞活化综合征诊疗专家共识.docx VIP
- 声乐课程教学大纲-音乐学院.pdf
- 食品安全管理保障措施.doc VIP
- 燃气锅炉安全隐患排查治理检查表.doc VIP
- (2023秋)冀教版一年级数学上册《 前后、左右》PPT课件.pptx VIP
- 课程设计与授课技巧.pptx VIP
- 巨噬细胞活化综合征与幼年特发性关节炎 MAS and SOJIA.ppt VIP
文档评论(0)