- 1、本文档共33页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大数据和管理科学
从管理科学视角对大数据研究的思考
合肥工业大学 杨善林
大数据与管理科学
2015年1月
对大数据的认识
大数据中的管理问题
三 大数据研究的前景
四 大数据的研究方法
汇报提纲
大数据与管理科学
在提出大数据概念之前,实际上已有很多关于大数据的获取、存储、处理和利用方法的研究成果。这说明实践是先于理论的,当然深入的理论研究一定能够促进大数据应用实践更好更快的发展。
一 对大数据的认识
1 《大数据时代》中的部分观点
(1)关于大数据的神奇传说
① 谷歌通过观察人们在网上的搜索记
录,提前几周成功预测了2009年在
美国爆发的甲型H1N1流感。
② 埃齐奥尼利用大数据创立了一个机
票价格预测系统,准确度高达75%,
平均每张机票可节省50美元。
一 对大数据的认识
③ 农夫山泉为处理每月收集的3TB业务数据,建设了亚洲第一个SAP Hana分析平台,为运营决策提供及时、准确的数据支持。
④ IBM智慧的分析洞察。每个月,全球发布10亿条Twitter信息和300亿条Facebook信息。预计到2020,总量增长约44倍。基于大数据的企业数据分析正成为IBM的利润增长。
一 对大数据的认识
一 对大数据的认识
(2)大数据引起的思维变革
① 在大数据时代进行抽样分析就像是在汽车时代骑马一样,我们分析数据会完全抛弃样本分析,而关注数据的总体。
即“样本=总体”。
在大数据时代,我们不再担心某个数据点对整套分析的不利影响,我们要做的就是要接受这些纷繁的数据并从中受益,而不再以高昂的代价消除所有的不确定性。
大数据时代对我们的生活,以及与世界交流的方式都提出了挑战,社会需要放弃它对因果关系的渴求,而仅需关注相关关系。
一 对大数据的认识
总之,我们需要改变我们的思维方式,使用我们能收集到的所有数据,而不仅仅是使用样本。我们不能再把精确性当成重心,我们需要接受混乱和错误的存在。另外,我们应该侧重于分析相关关系,而不再寻求每个预测背后的原因。
——引自《Big Data: A Revolution—That Will Transform How We Live, Work and Think》
2 关于大数据的定义
(1)美国国家科学基金委(NSF)的定义
大数据是指由科学仪器、传感器、网上交易、电子邮件、视频、点击流和/或所有其它现在或将来可用的数字源产生的大规模、多样的、复杂的、纵向的和/或分布式的数据集。
这个定义指出了大数据是一类数据集,并指出了大数据现在和将来的数据来源,以及大数据具有大规模、多样性、复杂性、分布性、关联性等数据特征。
一 对大数据的认识
(2)麦肯锡公司(McKinsey Company)的定义
大数据是一个大的数据池,其中的数据可以被采集、传递、聚集、存储和分析。目前,大数据是全球经济每个部门和功能的一部分。与固定资产和人力资本等其它重要的生产要素类似,没有数据,很多现代经济活动、创新和增长都不会发生,这正成为越来越普遍的现象。
这个定义指出大数据是一个大的数据集合,它与固定资产、人力资本一样,也是一种生产要素,并能支持现代经济增长和创新活动。因此,大数据研究的关键科学问题应该是大数据与经济增长和创新活动的关系。
一 对大数据的认识
(3)IBM公司的定义
可以用四个特征来描述大数据,即规模性(Volume)、高速性(Velocity)、多样性(Variety)和真实性(Veracity),这些特征相结合,定义了IBM所称的“大数据”。
这个定义显然也是把大数据定义为一种数据集合,而且这些数据具有规模性、高速性、多样性和真实性。所以,大数据研究所关心的科学问题就应该是对结构多样性的大数据能够进行高速存储和高速处理的技术。
一 对大数据的认识
(4)维基百科(Wikipedia)的定义
大数据是指规模庞大且复杂的数据集合,很难用常规的数据库管理工具或传统数据处理应用对其进行处理。其主要挑战包括数据抓取、策展、存储、搜索、共享、转换、分析和可视化。
显然这个定义是从大数据的处理方法和处理工具的视角来看待大数据的,根据这个定义,大数据研究应该围绕大数据的快速处理方法和软件工具的研发来展开,研究的目的就是要得到大数据的快速处理方
文档评论(0)