国内外大数据行业重点企业市场竞争规模分析预测及细分应用领域投资战略评估咨询.docVIP

国内外大数据行业重点企业市场竞争规模分析预测及细分应用领域投资战略评估咨询.doc

  1. 1、本文档共14页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

PAGE

PAGE1

国内外大数据行业重点企业市场竞争规模分析预测及细分应用领域投资战略评估咨询

1、大数据行业发展背景:

(1)大数据时代下传统数据管理软件面临多种挑战:近年来随着互联网、移动互联网、物联网、5G等信息通信技术及产业的不断发展,全球数据量呈爆发式增长态势。数据作为和土地、资本、劳动力、技术一样的生产要素,在数字经济不断深入发展的过程中,地位愈发凸显。我国是数据资源大国,根据统计数据,到2020年,中国数据量约12.6ZB,较2015年增长7倍,年复合增长率为124%。2025年中国的数据量预计达到48.6ZB,约占全球数据总量的30%。数据资源总体呈现出“4V”的特点,即海量的数据规模(Volume)、多样的数据类型(Variety)、价值密度低(Value)、快速的数据流转(Velocity)。

海量的数据规模指数据量大,包括采集、存储和计算过程中所涉及数据量都非常大。大数据的起始计量单位通常是PB(约1,000TB)、EB(约100万TB)或ZB(约10亿TB)。多样的数据类型指数据种类和来源多样化,包括结构化、半结构化和非结构化数据,具体表现为关系型数据、日志、音频、视频、文本、图片、地理位置信息等类型数据,多类型的数据对数据的处理能力提出了更高的要求。

中金企信国际咨询权威公布《大数据行业全景深度分析及投资战略可行性评估预测报告》

价值密度低指有价值数据所占比例低。随着互联网以及物联网的广泛应用,信息感知无处不在,信息海量,但价值密度较低,通过结合业务逻辑并通过强大的机器算法来挖掘数据价值,是大数据时代需要解决的重要问题之一。

快速的数据流转指数据增长速度快,处理速度要求快,时效性要求高。例如实时监测场景中,企业需要对物联网设备数据进行实时处理并做出反应;零售电子商务应用类软件将消费者所持的移动设备的地理位置信息和其个人偏好相结合,推送有针对性的促销信息。这是大数据区别于传统数据使用的显著特征。

随着信息技术以及实际业务需求的快速发展,传统数据管理软件在处理大数据场景时不能很好适应数据的“4V”特性,面临较多技术挑战。因此,传统数据管理软件迫切需要技术革新。

(2)传统集中式软件栈向新兴分布式软件栈演进:随着信息技术的发展,数据处理需求的变化推动了数据管理软件技术的变革,从技术发展方向来看,数据管理软件技术发展历程包括以下三个阶段:

数据管理软件主要技术演变及代表性公司分析

1970-2000年,数据管理软件主要为集中式架构的关系型数据库,其软件产品具备不可分割性(atomicity)、一致性(consistency)、隔离性(isolation,又称独立性)、持久性(durability)即“ACID”功能特性,占据了数据管理软件的主导地位。关系型数据库技术出现在20世纪70年代,经过二十余年的发展,到90年代已经成熟。市场上具有代表性的集中式架构关系型数据库产品包括Oracle、IBMDB2以及微软SQLServer等。

2000年以来,随着互联网和计算机技术的快速发展,需要处理的数据量更大、类型更丰富、速度要求更快,传统集中式计算架构已无法适应数据海量、异构、多源等特点,在部署的扩展性、容错性、经济性、灵活性等方面有一定局限性。谷歌于2003年-2006年间的三篇论文奠定了分布式存储和计算的基础,而后行业从业者基于以上理论建立了Hadoop、Spark等大数据分布式系统框架,并交由Apache软件基金会托管;2009年,在JohanOskarsson开源分布式数据库的讨论中,来自Rackspace的EricEvans重提NoSQL概念,用以指代非关系型的分布式数据存储系统。针对于不同的场景,分别产生了图数据库、搜索引擎、文档数据库、键值数据库等NoSQL数据库,代表性NoSQL数据库提供商包括MongoDB、Elastic等。

2010年以来,随着数字化转型的逐步深化,快速变化的业务场景呈现了复杂化、多样化的态势。复杂的业务场景往往需要使用多种数据模型,以及数据模型间的融合。

这个时期的,行业内大部分数据库都是面向单一数据模型而设计的,用以解决特定业务场景的特定问题。例如,使用传统的关系型数据库解决结构化数据的存储和处理问题、使用图数据库解决图相关的存储和处理问题、使用文档数据库解决文本相关的存储和处理问题。由于结构化数据和非结构化数据通常以不同的格式和模式存储,单模型数据库虽然优化了数据存储和处理,却难以满足日趋增长的、多样的业务场景需求。当同一业务需要用到不同类型数据的时候,受限于单模型数据库的处理能力,客户往往需要部署多个相互独立的单模型数据库,在对不同模型数据进行联合处理的时候,需要对数据进行搬迁或融合,导致架构复杂度高、开发成本高、运维成本高以及数据处理效率低

文档评论(0)

leet1201 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档