大数据时代下数据挖掘-简易.pptVIP

  • 2
  • 0
  • 约5.43千字
  • 约 33页
  • 2018-11-15 发布于浙江
  • 举报
大数据时代下数据挖掘-简易.ppt

总结与展望 现状:作为一个新兴的研究领域,数据挖掘已经取得了广泛和重大进展。应用到众多领域,出现了大量的商品化数据挖掘系统 发展方向:对现有方法进一步改进,研究发展数据挖掘语言的标准化,可视化方法和处理复杂数据类型的新方法 目前面临困难:成功案例少,中小企业需求少,人才稀缺。 为了更好的理解什么是大数据,我们先来看两个具体的实例。 第一个是关于公共卫生方面的,在2009年,甲型H1N1流感(就是我们俗称的甲流)在全球爆发传播,为了发现和控制疫情,各国政府和卫生相关部门付出了巨大努力,但得到的数据仍然滞后一两周。 Google每天会收到来自于全球超过30亿条的搜索指令,其中也包含“咳嗽、发烧、甲流”等方面的搜索引擎,但到底哪些词条更重要需要进行分析,Google处理了5000万条历史记录、4.5亿个不同的数学模型。在将得出的预测与2007年、2008年美国疾病控制中心的实际流感病例进行对比之后,Google的软件发现了45条检索词条的组合,将这些词条用于一个特定的数学模型后,Google的预测结果与官方的结果相关性达到了97%,这样Google能够立刻判断出流感是从哪里传播出来的,没有一两周的滞后。而且不需要像卫生部门那样发放口腔试纸以及联系医生,大幅度降低了成本。 * 再来看另一个例子, 季节、航空公司营销策略等众多因素都可能影响机票的价格,Farecast是一个对机票价格进行

文档评论(0)

1亿VIP精品文档

相关文档