将大数据变小.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
PAGE PAGE 1 将大数据变小   历来,人们对数据有着特殊的钟爱,谁掌握和提供的数据越多,谁的观点就越有说服力。然而,由多终端、多平台驱动的“大数据时代”的到来与深入,让迷恋“用数据说话”的人们感到纠结。在数据的汪洋中,哪些才是最有价值,最具说服力的利器呢?   事实上,虽然人们每天都在创造大量的数据,但是作为一种术语和概念,大数据对很多人来说是相对陌生的,即使是业内专业人士,关于大数据的定义也存在争议。一些人认为,大数据的关键特征是数据库的容量,而另一些人则认为是数据的复杂性,还有些人认为,其关键特征是数据的集中与分析的速度。   国双科技董事长兼首席执行官祁国晟支持最后一种观点,也就是将海量的大数据尽快变成有价值的小数据才有价值。而他领导的这家公司就是基于GridsummDissector云计算平台,帮助用户度量、分析并优化其在线业务,提供产品与服务。   这位28岁的CEO称,从2005年创立至今,公司所赚到的每一分钱几乎都是靠处理数据、分析数据挣来的,因此他的观点更具实践意义。他认为,大数据就是在硬件平台有限的条件下,通过软件技术的提高,在传统的数据库之外,通过对海量数据的挖掘与分析,在最有效的时间内发现数据中蕴藏的商业智能。而那些仅仅是被存储,失去关联性,无法及时处理和调用的数据,不能称为大数据。   可贵的大数据   原始的大数据正是谷歌和亚马逊成功的原因。据美国得克萨斯大学的一项研究数据显示,如果企业对于数据的使用率哪怕提升10%,零售行业的利润率将提升49%,咨询行业提升39%,航空行业提升21%。而据麦肯锡的一份关于大数据的报告显示,美国受益于大数据技术的应用和分析,其零售行业增长超过了60%,同时使制造成本降低了50%。   然而大数据不仅是企业趋势,也在改变人们的生活,在大数据的帮助下,警察可以通过犯罪数据和社会信息来预测犯罪率等。相对于根据小范围数据样本进行推断,大数据能够实施比以往精确得多的监测与分析,当然前提是可以对整个数据集进行有效的分析。   一个令人神往的应用来自医疗领域。以往被临床医生用来判断病因的经验和直觉,逐渐被质化和量化后,被那些经验并不丰富的医生所利用。而如果要确保患者每次都获得最好的诊治,就不能仅仅依靠直觉和专业的技能了,因为人无完人。   于是,人们通过基于证据的医疗方法(EBM)来帮助医生提高治疗水平,就是把临床研究整合进治疗准则。而一直以来基于“小数据”的研究获得的结果,被人们嘲笑为“菜谱式治疗”。由于在小数据集中只能使用单一的术语,无法做出确凿的归纳,医生们只是机械地遵循着这些治疗的“配方”来治病,而在解释病人的个体差异时就显得力不从心。   大数据则足够用来创造更加个性化的“治疗菜谱”,允许人们通过粗略的未经处理的数据逐条比对,来发现微小但强有力的线索,进行分析研究。这让计算机模仿人类医学专家的直觉成为可能。   只不过,在今天的医疗体系中,只有通过审核的、标准的、被编辑过的数据才能被接收。这个屏障过滤掉了粗糙的原始数据,创造了同质化的数据,排除了能使系统真正有用的多样性,而且一旦泄漏数据集信息将受到重罚,但建立这样数据集的利益却几乎不存在,因此这一应用还存在于理想之中。   不过在金融、汽车、快消行业,在市场营销、城市管理、电子政务等领域,大数据技术已经得以发挥。   国双科技高级副总裁续扬有一个听起来有点复杂的实例。三年前,欧莱雅旗下的兰蔻在搜索引擎SEM投放过程中遇到了问题。账户中一类词花费很多,但是用量化统计系统跟踪,它带来的直接订单却非常少,这类词叫“口碑词”,诸如“四十岁眼霜哪家好”等。借助国双提供的工具发现,访问者通过“四十岁眼霜”进入兰蔻官网,但并未买单;三天后通过“兰蔻促销”搜索再次进入企业官网,仍未下单;又隔了五天搜索“兰蔻”进入官网;再过了五天,在地址栏中输入网址直接进入官网,这一次他买了2200元的产品。   这个过程中,口碑词如同足球赛中的抢球队员,后面的几次搜索的词汇如同传球队员,最后直接输入网址购买就像射门球员。在常规的、不是基于大数据的量化工具中,功劳将全部归入射门球员,但事实上显然并非如此。这就是目前市场营销中位居前沿的数据模型“归因模型”。   微博的商业价值也更多地体现在传输作用上,“这证明了量化数字的分析已经到达了一个可以分析现在、分析过去数据,最终推导未来行为模式的情况”。续扬说,“大数据对于市场营销带来了三个里程碑:由网下的数据很难量化,变成网上的数据可以初步地量化;初步的量化变成深入的量化;再进一步,可以变成可能追溯的数据分析。这是重大的变革。”据悉,目前通过国双数据分析系统所分析的广告预算,每年超过10亿人民币。   初创企业的新机遇   上世纪80年代,尼尔森(Nielsen)曾为部分美国家庭安装用以测量全

文档评论(0)

gmomo-lt + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档