旅游大数据理论、技术与应用 课件 第5、6章 旅游大数据存储与管理、 旅游大数据处理与分析.pptx

旅游大数据理论、技术与应用 课件 第5、6章 旅游大数据存储与管理、 旅游大数据处理与分析.pptx

【第5章】 旅游大数据存储与管理;导读;;第1节 ;第1节 ;第1节 ;第1节 ;第1节 ;第1节 ;第1节 ;第1节 ;;第2节 ;第2节 ;第2节 ;【第六章】 旅游大数据处理与分析 ;导读;01 旅游大数据处理技术;;一、大数据批处理计算;大数据批处理计算;;;;;在介绍大数据批处理计算时,我们知道Spark是一个快速计算的大数据引擎(与MapReduce相比),它将原始数据分片后计算,对于处理数据量不大、过程不复杂的任务,可以在秒级完成任务。SparkStreaming是Spark核心API的一个扩展,可以实现高吞吐量的、具备容错机制的实时流数据的处理SparkStreaming巧妙地利用了Spark的分片和快速计算的特性,将实时传输进来的数据按照时间进行分段,把一段时间传输进来的数据合并在一起,当作一批数据,再去交给Spark去处理。 有人认为 Spark Streaming 不是真正的实时流计算,只是一种模拟的、近似的实时流计算。;;;;;;一、描述性分析;;;;;;;;分词;;;;;一、旅游 OTA 平台供给侧大数据分析;;;;;;;;再加工搜索大数据;原始搜索大数据;;;;;;

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档