华院数据COO麦星:产业大数据生态建设者.docxVIP

华院数据COO麦星:产业大数据生态建设者.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
华院数据COO麦星:产业大数据生态建设者.docx

华院数据COO麦星:产业大数据生态的建设者2016年3月16日,正值数据六合实验室成立一周年,“数商·据智·六合”大数据行业应用高峰论坛在沪隆重举行。华院数据COO麦星受邀在论坛上发表了主题演讲,并向在场的300余位参会嘉宾分享了华院作为产业大数据生态的建设者所做的一些探索和经验。以下是华院数据COO麦星在论坛现场的发言实录:大家好,今天跟大家分享的是华院数据在过去那些年里做的有关大数据开发、大数据应用的事情,也跟大家交流一下我们在做“大数据应用”时的一些经验,我今天演讲的题目是:华院数据——产业大数据生态的建设者。这是我们最近一段时间想了很久,我们对于自己的一个定义。华院数据在大数据领域是比较早开始耕耘的,事实上我们是从2002年就开始做现在所说的“大数据”的事情了,那个时候叫“数据挖掘”。在座的有我们最老的客户和朋友,就是新疆移动的很好的朋友、很好的客户,那个时候我们已经开始为全国的移动运营商做这种数据挖掘的工作。我们现在可能有时候会被称为大数据,但是实际上那时候可能拥有大体量数据的厂商大概只有运营商或者是银行。所以我们当初开始做一系列的数据建模、数据挖掘的工作,从多方面去观察我们的个体用户是一个什么样子的,可能从几百个维度甚至上千个维度进行刻画,这些东西通过人脑是没有办法处理的东西。我们还做了一些预测,就是客户行为预测。我们能预测各位拿手机的朋友们,下个月会不会跳转到其它的运营商里面,或者是下个月会不会购买其它的产品,或者会退出什么样的套餐等等。这些也是我们用个体的行为,通过数据挖掘建模的方法进行预测。很有意思,正好昨天AlphaGo比赛结果出来了。AlphaGo背后实际上是神经网络算法的胜利。我们在2002年开始就已经在数据建模里面广泛的应用神经网络了,确实我们现在回想起来大概十多年过去了,神经网络的发展也是随着大数据的浪潮一拨一拨被推起来了,当初在我们看来,神经网络没有什么绝妙。它在数据建模的时候,跟决策树,跟一般的回归得出来的准确率其实没有大的差别,虽然说算法上相对来说比较悬,那个时候其实并没有被别人注意。后来到了2006年真正的一篇“深度学习”的论文出来之后,开始对神经网络有了算法上的优化。到了2012年在一个大赛上,神经网络的预测方法,深度学习的方法脱颖而出才开始被广泛应用。昨天围棋赛的胜利,在我们作为大数据挖掘的看来,实际上是很了不起的胜利。因为它跟IBM的深蓝不一样,原来我们靠的是计算机的速度快,记忆力强,可以记更多的棋谱,可以算更多的步数,简单的利用很强的运算力,就可以在国际象棋或者中国象棋这样的计算量上面就可以获胜。但是围棋不一样,它是19格×19格的量,这很难通过“暴力解题”达到这样的效果。其实神经网络给我们提供了一个非常好的算法,它能够产生自己学习、自己训练,也就是自己建立一个对手互相PK,迅速的获得一个最优的结果。简单的说,实际上在神经网络的优化上面,有非常非常多的步骤和细节在里面。华院数据有一个首席科学家,写了一篇文章,关于AlphaGo计算方法的详解,我建议大家如果有兴趣的话可以看一下。我们对神经网络AlphaGo掀起的这个热点上面,我觉得在未来,再回过头来看的时候,也许是一个社会对大数据理解的里程碑。虽然说它是一个社会性的事件,但是将来再过若干年可能回过头来看,可能真的是推动了整个数据对大数据,对于人工智能应用的一个理解,从而也许会带动一系列的这种产业的发展。 回过来讲华院,我们其实进行了长达10年的数据挖掘的咨询工作,积累了很强的团队,也积累了很多的在数据挖掘应用上的经验。到了2011年的时候,大数据开始在社会上流行起来。越来越多的传统企业开始讨论大数据,开始准备拥抱大数据。所以从那个时候我们开始尝试着孵化了第一个子公司“数云”,现在“数云”估值可能已经接近10亿了。它做的是网商,对于淘宝、天猫、一号店这样的网商在线建模,我们使得在线的电商通过他们已经积累下来的数据对于自己的客户有一个全面的了解,通过在线建模之后可以对客户有精准的分类、预测。之后华院接受了红杉资本的投资,在2012年的时候,后面我们开始放大了步子,开始孵化产生了一系列的新公司,比如:数创。六禾也投资了数创,还有“数尊”,公司是做信用评分的。也就是说,通过我们可以接入的社会上广泛的数据,可以做这种个体的信用评分。“数尊”做的其实是P2P,银行小贷进行风控的评分。之后我们还在美国的硅谷成立了NewA Tech,有跟海尔合作的析远公司,有跟凤凰文化合资的塔美,还有“小宝在线”,还有做教育的智能教育“数加”公司,还有做城镇O2O的“集买”公司。现在还有一系列新的公司,包括做医疗方面的,儿童用药不良反应方面的等等。所以大家可以看到,华院数据在过去的14年间,其实跟着社会数据进程走过了这样一个解体。从数据挖掘到“大数据+”,再到现在大

文档评论(0)

cai + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档