- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
j不讲大数据就“OUT7了
■如何理解大数据
■技术,大云平移
■产业:商业革命
■资产:数据资产
■思维:管理革命和思维革命
■大数据时代:改变我们的生活、工作和思维方式-Gartner公司(3V+1):大数据是指数量大、变化快和(或)多样化的信息资产,需要新的处理形式,从而强化决策、促进洞察力和优化流程;|数据量(Volume)
■全量超大规模(海量)
■K、MB(兆)、G、T、P,E、Z、Y.N、D、C■大数据的起始计量单位至少是P(1000个T)
■不仅是规模,更重要的是增长速度
■到2012年,人类生产的所冇印刷材料数据量是200PB,全人类历史上说过的所有话的数据量大约是5EB■整个人类文明所获得的全部数据中,有90%是过去两年内产生的
■到了2020年,全世界所产生的数据规模将达到今天的44倍;■速度(Velocity):实时变化(输入和处理速度快)
对处理时间的要求
?■种类~^ariety)y:多样化(多源异构)
-结构化
■非结构化:文本、图象等
■价值(Value):价值密度低
■大海捞针?
■数据本身不产生价值,如何分析和利用大数据对业务产生帮助才是关键
■例:Facebook上市前有形资产价值66亿美元,但估值1040亿美元
■2009年-2011年间收集了2.1万亿条获利信息;j_大有大的道理__
-戴明:除了上帝,任何人都必须用数据来说话■对大部分事物来说,平均值都差强人意
■但在决策中,大量个体的平均值往往是最好的■猜猜瓶子里有多少钱?
■猜得最准的个人距离正确答案10美元
■所有猜测的平均值距离正确答案3美元
■365美元;o;光大是不够的
■数据并不是越多越好
■对数据分析能力的挑战:由人米解读转化为洞察见解■科斯:如果你总是拷问数据,数据迟早会招供的
■有一位美国数学家最怕坐飞机
■他研究了近20年的统计数据,发现恐怖分子带炸弹上飞机的概率非常低
■但他还是不放心,又做进一步研究,发现两个人同时带炸弹上飞机的概率为零
■于是他坐飞机都自己携带一枚炸弹
■水生动物不要羡慕陆生动物的四个蹄子,它真正需要的是生出一个肺,而不是用腮呼吸;林彪的大数据思维
■辽沈战役期间,林彪要求每天要进行;大数据内涵的三维度解析
实践;大数据的本质
■用母体代替抽样
■统计抽样的局限性
■用数量代替精确
■拥抱混杂性:容错性更强
■用相关性代替因果性
■知道是什么比知道为什么更重要
■演绎与归纳的区别
■演绎:通过一般规律推导出具体事实(从因到果)-归纳:从具体事实中总结出一般规律;I大数据的启示:;GaryLoveman博士的经历
■1989年在MIT获经济学傅士学位后在哈佛商学院任教;i哈拉斯娱乐公司的特色
-每年在信息系统上的投资超过1亿美元
■推行了一套名为“完全回馈”(TotalReward)的会员卡制度,所有消费都用卡
■到201?年,己积累超过4000万会员的信息,是博彩业最大的客户数据库
■公司从地方性企业成长为全球最大的博彩公司(拥有39家本土赌场、13家海外赌场)
■2010年改名为凯撒娱乐公司(Caesars
Entertainment);利用大数据提供优质服务
■通过对顾客消费模式的分析,计算出顾客的长期价值(customerworth)
?一个顾客理论上长期会在Harrahs总共消费多少
■26%的客户贡献了82%的收入:前者并不是大多数赌场一直在争取的金领豪客,而是中产阶级的屮老年顾客(教师、医生、银行职员等)
■系统能根据顾客背贵资料及历史消费模式计算出顾客的痛苦点(painpoint)
-如果他输钱超过痛苦点,今晚的赌博会成为一个痛苦的回忆,离开Harrahs后一去不返
-实时做出对策:提供免费餐券劝退;投资决策
■电影《永无止境》的故事;大数据实践
■广泛应用数据、使用统计与量化分析方法、使用描述性与预测性模型以及基于事实的管理方法影响决策和行动
■核心:用大数据思维去发掘大数据的潜在价值;i以基于大数据的预测分析为例
■消赀行为:营销
■人的社交活动:恋爱、离婚、生育
■人的思考与决策:竞选、论文评分、情绪■人的放弃:惠普对30多万员工的离职风险评估■事故:保险、破产
■疾病和死亡
■撒谎、欺诈、犯罪
鶴丙格尔,《大数裾预测》,中信出版社,2014年4月■大数据预测的147项案例;7;_百度预测
*?景点预测
■疾病预测■城市预测■房地产预测■票房预测■就业预测■金融预测■世界杯预测
■高考预测;j百度大数据产品
?百度司南:一站式营销决策平台■人群分析
■品牌分析
?媒体分析
■舆情分析
■百度统计
■百度精算
■百度推荐
■百度筷搜?;j大数据:价值潜力与捕
原创力文档


文档评论(0)