网站大量收购闲置独家精品文档,联系QQ:2885784924

《大数据存储技术与应用》 课件 项目六_任务一 走进非结构化存储技术.pptx

《大数据存储技术与应用》 课件 项目六_任务一 走进非结构化存储技术.pptx

  1. 1、本文档共17页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

《大数据存储技术与应用》

什么是半结构化数据?

什么是Redis?

什么是ElasticSearch?

ElasticSearch的应用场景?

回顾

任务引入-GlusterFileSystem

GlusterFileSystem是一款自由软件,主要由ZRESEARCH公司负责开发,十几名开发者,最近非常活跃。文档也比较齐全,不难上手。

本节任务对非结构化数据进行探讨,结合非结构化数据特性剖析非结构化数据存储特点。

了解非结构化存储技术的概念。

掌握非结构化数据存储的特点。

任务概要

教学内容

非结构化数据概述

知识点一

(一)非结构化数据概述

非结构化数据是数据结构不规则或不完整,没有预定义的数据模型,不方便用数据库二维逻辑表来表现的数据。

非结构化数据其格式非常多样,标准也是多样性的,而且在技术上非结构化信息比结构化信息更难标准化和理解。

4.1.3.1安装依赖(5354)

1.体量大

非结构化数据可以是公司内部的邮件信息、聊天记录以及搜集到的调查结果,也可以是个人网站上的评论、客户关系管理系统中的评论或者是从个人应用程序中得到的文本字段。还可以是公司外部的社会媒体、社交论坛以及来自于一些感兴趣的话题的评论。

(二)非结构化数据优势

4.1.3.1安装依赖(5354)

2.价值高

非结构化数据中蕴藏着大量的价值信息,利用非结构化数据分析能够帮助企业快速地了解现状、分析趋势并且识别新出现的问题。

(二)非结构化数据优势

4.1.3.1安装依赖(5354)

3.可分析

数据分析不需要一个专业性很强的数学家或数据科学团队,终端用户有能力、也有权利和动机去改善商业实践,并且视觉文本分析工具可以帮助他们快速识别最相关的问题,及时采取行动,而这都不需要依靠数据科学家。

(二)非结构化数据优势

非结构化数据存储特点

知识点二

4.1.3.1安装依赖(5354)

针对非结构化数据体积大、增长快、格式标准多样化的特点,非结构数据存储技术必须具备以下能力:

一、能够快速地对大体积的非结构化数据进行读/写操作;

二、存储容量能根据需要适应非结构化数据的快速增长,能进行动态弹性的扩容;

三、能存储多种格式或标准的非结构化数据。

非结构化数据存储特点

任务小结

本节介绍了非结构化数据的特点,非结构化数据存储技术,包括非结构化数据的采集、存储和管理,并为非结构化数据的分析、挖掘及应用提供支撑。

非结构化数据有体量大、价值高、可分析等优势,非结构数据存储技术必须具备三个能力。

拓展训练

1.什么是非结构化数据?

2.非结构化数据存储需要具备哪三种能力?

作业

谢谢!

THANKS!

您可能关注的文档

文档评论(0)

lai + 关注
实名认证
内容提供者

精品资料

版权声明书
用户编号:7040145050000060

1亿VIP精品文档

相关文档