- 0
- 0
- 约1.49万字
- 约 61页
- 2019-02-18 发布于安徽
- 举报
第一V是Variety,海量数据有不同格式,第一种是结构化,我们常见的数据,还有半结据化网页数据,还有非结构化视频音频数据。而且这些数据化他们处理方式是比较大的。 很多不同形式(文本、图像、视频、机器数据),无模式或者模式不明显,不连贯的语法或句义 第二点就是Volume,量比较大,我们有一些用户化每秒就要进入很多数据,很多客户内部都有几批数据,还有下面淘宝都是几PB数据,所以PB化将是比较常态的情况。 非结构化数据的超大规模和增长,占总数据量的80~90%,比结构化数据增长快10倍到50倍,是传统数据仓库的10倍到50倍 第三个是Velocity,因为数据化会存在时效性,需要快速处理,并得到结果出来。比如说,一些电商数据,今天的信息不处理没有结果化,将会影响到今天捕获很多商业决策。 立竿见影而非事后见效 第四个是Value:大量的不相关信息,不经过处理则价值较低,属于价值密度底的数据 海量数据分析非常复杂,使得过去靠单纯易于关于数据库BI已经不是太适合了。所以,可能需要新的创新。 * 云计算只是一个概念,很多人也都会,一说起云计算,就觉得会想吐的感觉,现在大家都在说云计算,各种各样的服务,各种各样的公司,各种云,总在说云计算是一个概念。百度,也是一个很典型的云计算平台,他有很多很多的数据会在上万台服务器上出运算,这个可能在传统的一些计算环境是无法满足的。 * * * 当
您可能关注的文档
最近下载
- 西门子S7-1200 PLC编程及应用(第二版):S7-1200PLC编程指令PPT教学课件.pptx
- 道岔缺口监测系统QC成果 .ppt VIP
- 道岔缺口监测系统QC成果课件.pptx VIP
- 道岔缺口监测系统qc成果.ppt VIP
- 可编程控制器应用技术第2版[西门子S7-1200](PLC)高职PPT完整全套教学课件..pptx VIP
- 道岔缺口监测系统QC成果.ppt VIP
- 2025四川二造土建实务真题及参考答案.docx VIP
- 急诊检验实验室能力建设与规范专家共识(2025版).pdf VIP
- 污水检测报告模板.pdf VIP
- 宁夏普通高中毕业生登记表学生综合素质评价手册完整版.docx
原创力文档

文档评论(0)