- 1、本文档共2页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
大数据的基本特征
通常认为大数据具有“4V”特征,即规模庞大(Volume)、种类繁多(Variety)、变化频繁(Velocity)、价值大但价值密度低(Value),如图下所示。
大数据“4V”特征
1、规模庞大
大数据的体量非常大,PB级别将是常态,且增长速度较快。IDC发布的《数据时代2025》报告显示,全球每年产生的数据将从2018年的33ZB增长到175ZB,相当于每天产生491EB的数据。那么175ZB的数据到底有多大呢?1ZB相当于1.1万亿GB。如果把175ZB全部存在DVD(DigitalVersatileDisc,数字通用光碟)中,那么DVD叠加起来的高度将是地球和月球距离的24倍(地月最近距离约36.3万千米),或者绕地球236圈(一圈约为4万千米)。
2、种类繁多
大数据种类繁多,一般包括结构化、半结构化和非结构化等多类数据,如网络日志、视频、图片、地理位置信息等。这些数据在编码方式、数据格式、应用特征等多个方面存在差异,多信息源并发形成大量的异构数据。不同结构的数据处理和分析方式也有所区别。
3、变化频繁
数据的快速流动和处理是大数据区别于传统数据挖掘的显著特征。例如:涉及感知、传输、决策、控制开放式循环的大数据,对数据实时处理有着极高的要求,通过传统数据库的查询方式得到的“当前结果”很可能已经没有价值。因此,大数据更强调实时分析而非批量式分析,数据输入后即刻处理,处理后就丢弃。
4、价值大但价值密度低
大数据价值密度的高低与数据总量的大小成反比,单条数据本身并无太多价值,但庞大的数据量累积隐藏了巨大的财富。其价值具备稀疏性、多样性和不确定性等特点。例如:在连续不间断的监控过程中,可能有用的数据仅一两秒,但是无法事先知道哪一秒是有价值的。
您可能关注的文档
- 云计算架构优化的概念.docx
- 云桌面架构设计与部署方法.docx
- 石材与陶瓷板幕墙质量控制的一般规定.docx
- 金属幕墙质量控制的一般规定.docx
- 玻璃幕墙质量控制的一般规定.docx
- 石材幕墙加工质量控制方法.docx
- 金属幕墙安装质量控制关键点.docx
- 金属幕墙加工质量控制关键点.docx
- 安全事故反思总结心得体会.docx
- 最新提升患者满意度实施方案3.docx
- 趣味运动会活动策划方案_体育趣味游戏活动方案3.docx
- 2024年财政所工作总结汇报.docx
- 网络食品安全管理办法.docx
- 2025届江苏省南京师大苏州实验学校高考仿真卷历史试题含解析.doc
- 铜川市重点中学2025届高考历史押题试卷含解析.doc
- 湖南省武冈二中2025届高考历史押题试卷含解析.doc
- 2025届河南省平顶山市重点中学高三下学期联考历史试题含解析.doc
- 江苏省姜堰区蒋垛中学2025届高三第四次模拟考试历史试卷含解析.doc
- 2025届内蒙古赤峰市翁牛特旗乌丹第一中学高三考前热身化学试卷含解析2.doc
- 2025届云南省玉溪市元江民族中学高三最后一卷历史试卷含解析.doc
文档评论(0)