小数据企业的大数据时代.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
小数据企业的大数据时代   大数据业已成为管理界的时尚元素。然而,在大数据的盛宴中,谷歌、脸书的成功案例却如同鱼翅、鲍鱼一般难以进入寻常企业,大部分国内企业对大数据还是丈二和尚摸不着头脑。如何在技术、预算、人才的多重制约下,揭开大数据的神秘面纱,应用现有资源做好大数据管理是真正需要关注的问题。   大数据时代并非“忽如一夜春风来”,其理念在信息时代以前就有成功应用,只不过随着技术手段的不断成熟,现在实现起来更加容易。事实上,美国职业篮球联赛(以下简称NBA)从1980年代起使用的数据管理技术就是大数据的雏形,经过近30年的积累和完善,为我们提供了成熟的大数据管理经验,非常值得借鉴。也许有人会质疑,NBA一共只有30支球队,每支球队每年才打82场常规赛,其蕴含的数据甚至比不上谷歌一分钟的搜索量,NBA真的有大数据吗?归本溯源,还是要从大数据的概念入手。按照畅销书《大数据时代》对大数据的诠释,这个“大”并非必须是太字节(240字节)的数据,“大”取的是相对意义而不是绝对意义。   笔者尝试将此书中对大数据的概念总结为一个前提、三大特点和一个目标:   前提:一切都是数据。   特点一:向抽样说不。   特点二:向完美主义说不。   特点三:向因果关系说不。   目标:替人脑做不擅长的工作。   下面将以NBA的数据管理经验为例,对其进行诠释。   相信没有人会否认,将事件转化为数据是大数据管理的前提。NBA比赛是球员和球的运动,如果不转换成为数据就只是录像资料,靠人工反复回看提取资料效率很低,必须对比赛进行拆解、定义、记录,将其转换为数据才能进行处理分析。   拆解:将运动员的动作进行层层分解,变成尽可能小的单元,如将运动员场上行为先分为进攻、防守,再将进攻分为有球进攻和无球跑动,再将有球进攻分为运球、投篮,再将投篮分为上篮、中投、远投。拆解类似于巴巴拉 ? 明托在“金字塔原理”中提出的MECE(即Mutually Exclusive Collectively Exhaustive),中文意思是“互斥,完全穷尽”,“相互独立”意味着问题的细分是在同一维度上并有明确区分、不可重叠,“完全穷尽” 则意味着全面、周密。   定义:每一项拆解后的动作均有相对准确的定义,明确内涵和外延。如篮板球就是投篮不中后抢到并且控制住球的行为,碰到球但是未能控制住或者直接碰出界的球不算有效篮板。定义准确可以确保拆解出来的元素具有明确的含义。   记录:将拆解后且有准确定义的行为编码为数据储存起来。NBA记录了球员在比赛中的上场时间、得分、篮板、抢断、盖帽、失误等一系列基础数据,并且放在公开的数据库里,可供任何人随时查询,这也是NBA进行决策的依据。现在的存储成本几乎已经低到了可以忽略的程度,随便一块硬盘都是以TB为计量单位,更不要说日趋成熟的云技术。编码过程相对复杂,以往NBA使用人工进行记录,每场比赛都会有若干工作人员全神贯注地记录每一个细节,而现在使用了SportVU系统,这个系统将最先进的导弹追踪技术引入NBA,通过在球场架设的多台摄像机全面收集数据,用电脑自动将比赛过程的每个细节转化为数据存储,节约了大量的人力成本。   有了拆解、定义、记录的方法,可以将绝大多数企业中的绝大多数事件和行为转化成为数据,也就有了实施大数据管理的基础。其中,拆解和定义环节只需要熟悉本行业的流程就很容易实现,科学管理的先驱泰罗在20世纪初就将工人搬运等动作成功转化为数据。最大的难题还是出在记录环节,靠人工记录一组搬运的数据不难,但是仅凭人工记录所有搬运数据显然是天方夜谭。我们必须承认,即使是现在的科技也不可能记录编码所有行为,但在技术的帮助下可以做得更好。例如可以完善现有的IT系统,使系统可以记录更多信息。以餐饮行业为例,基本每个餐厅都有点菜系统,通常只具备简单的计算功能,可以进行技术升级以记录更多信息,例如可以增加数据存储字段记录顾客点菜时间和结账时间;可以通过与会员卡绑定记录顾客消费行为和消费习惯;可以分解记录每位服务员的服务业绩;可以记录菜品投诉和退菜情况事实上只要多花些功夫,仅仅投入不大的成本就可以在现有技术条件下收集到更多的数据,对于无法完整转化的事件和动作,可以选择暂时搁置或者等待技术完备时再进行记录(可以预计,动作识别和语音识别的低成本化指日可待)。   特点一:向抽样说不   ――但求广度的非抽样整体数据采集技术   所谓抽样就是全体中抽取一部分样本,其基本要求是要保证所抽取的样本对全体具有充分的代表性,即要确保样本有和全体一样的特性。在计量成本很大,技术达不到的情况下,抽样是无奈之举,但如果能够低成本高效率的统计全体数据,抽样就是画蛇添足。而且由于抽样技术本身的制约及随机性因素,抽样很容易出现以偏概全的问题。在迈克

文档评论(0)

kaku + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8124126005000000

1亿VIP精品文档

相关文档