- 1、本文档共57页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 亚马逊“预测式发货”的新专利,可以通过对用户数据的分析,在他们还没有下单前,提前发出包裹。 这项技术可以缩短发货时间,从而降低消费者前往实体店的冲动。(因为在下单到收获之间的时间延迟可能会降低人们的购物意愿,导致他们放弃网上购物) 亚马逊根据之前的订单和其他因素,预测用户的购物习惯,从而在他们实际下单前就将包裹发出。根据该专利文件,虽然包裹会提前从亚马逊发出,但在用户正式下单前,这些包裹会暂存在快递公司的转运中心或者卡车里。 亚马逊为了决定要运送那些货物,可能会参考以前的订单、商品搜索记录、愿望清单、购物车、甚至包括用户的鼠标在某件商品上停留的时间。 * * 2012年11月奥巴马大选连任成功的胜利果实也被归功于大数据,因为他的竞选团队对选民的行为、支持偏向进行了数据搜集,并进行了大规模与深入的数据挖掘。在这次大选中,奥巴马竞选阵营的高级助理们决定将参考得到的数据分析结果来制定下一步的竞选方案,从而获得选民的支持。 * * 早在2009年,上交所曾经利用“大数据”设置“捕鼠器”的设想,设定一定的指标预警,当相关指标达到某个预警点时,监控系统会自动报警。 深交所“大数据”监控系统,设置200多个指标用于监控估计,一旦出现股价偏离大盘的走势,将利用大数据查探异动背后的机构或投资人。 马乐案,监管系统发现有三个账户的交易特点和当时的博时精选基金高度重合,从交易记录上可以看到,持股时间最长不过一两个月,大多是三四天、四五天。 * * 阿里“水文模型”是按照小微企业类型、级别等分别统计一个阿里系客户的相关“水文数据”库。 如过往每到一个时点,该店铺销售会进入旺季,销售额就会增长,同时没到这个时段,该客户对外投放的额度就会上升,结合这些水文数据,系统可以判断出该店铺的融资需求;结合该店铺以往资金支出数据及同类店铺资金支用数据,可以判断出该店铺的资金需求额度。 * * * * * * * * 一、大数据的相关概念 二、大数据分析 三、大数据应用的典型案例 四、大数据的可靠性 五、大数据与贝叶斯方法 * * * * 大数据思维的相关关系可以替代因果关系吗? 大数据思维下可以直接用调研结果来指导实践吗? * * 在2011-2013年的三年间,谷歌流感模型的预测出现严重偏差:一直在高估流感的事态。其中最严重的偏差出现在2013年1月,谷歌产品估计的结果是CDC汇总实际结果的2倍。 * * 谷歌的目的是估算禽流感在整个美国的发病率。数据来源是自用户使用搜索引擎的检索记录,即谷歌用搜索关键字的网民行为来预测整个国家人们患病的可能性。 Q1:有禽流感症状的人都会使用google搜索关键字吗? Q2:用google搜索关键字的人都有禽流感症状吗? * * 谷歌模型失败原因 谷歌模型是基于关键字和发病率的关系来进行预测。大数据思维重视相关性(A和B同时发生),却忽略了因果关系(A导致B发生)的分析。 随着流感的发展,媒体不断增加对流感的报道,引来越来越多人的重视,也就有相应一部分人会通过google来搜索流感关键词,但是这些人并不一定得了流感。 1 A导致B 2 B导致A 3 C导致A和B 4 A和B互为因果 5 小样本引起的巧合 A和B的关系 * * 2004年,我国某知名电视机生产公司因为一次市场调查的结果,解雇了市场调研部的大量员工 * * 为调查该企业电视机品牌的市场占有率,该公司排除市场研究部的两组员工,调查消费者会选择的电视机品牌。 Q:为什么同样的抽样方法结果差异这么大? ? 愿意购买 不愿购买 A组 36% 64% B组 16% 84% * * Q:为什么同样的抽样方法结果差异这么大? 原因: 1 A组调查员在询问过程中均戴着有该公司logo的领带 2 在问题的选项中,该公司的名字排在众多品牌的第一位 * * “大数据,大偏差” 科学的技术 诚实的态度 严密的操作 一、大数据的相关概念 二、大数据分析 三、大数据应用的典型案例 四、大数据的可靠性 五、大数据与贝叶斯方法 * * 假设掷出一枚硬币,正面朝上的概率是50%,如果连续99次投掷硬币都是正面朝上落地,那么下一次投掷硬币正面朝上落地的概率是多少? 这是Taleb在《黑天鹅》一书中给出的一个假想的问题。在Taleb的书中,受过正统教育的约翰博士给出了教科书教给我们的标准回答,下一次投掷硬币正面朝上落地的概率仍然为50%,因为下一次硬币朝向与之前投掷的结果无关。而教育背景没有那么光鲜的胖托尼则认为下一次投掷硬币正面朝上的概率为99%。孰对孰错?每个人都不妨给出自己的判断。
文档评论(0)