中国数智融合发展洞察.pptxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
中国数智融合发展洞察摘要VUCA时代,市场变化加速。企业需要更加敏捷而准确的数智化决策,这些决策应当是分钟级的而非 天级的,应当是基于全量数据的而非局部数据的,应当是基于准确数据的而非基于“脏数据”的,应 当是业务人员和数据分析人员任意发起的而非是通过复杂流程和多部门配合才能实现的。传统的数仓或者湖仓分离架构让数智融合和企业敏捷决策变得困难:数据孤岛存在,决策无法基于全 量数据;数据来回流转,成本高、周期长、时效差。基于存储-缓存-计算分离,湖-仓-AI数据统一元 数据管理的Serverless,可在数据量、成本、效率、敏捷方面取得最优解。开源为数智生态贡献重要力量,但这不预示所有企业需通过开源产品自建数智平台。实际上,大多 企业聚焦自己核心业务,选择性能稳定、无须运维、数智融合、端到端自动化与智能化的商业化数 智平台,ROI会更高。当然,平台应与主流开源产品具有良好继承性,如此,更加灵活开放,企业 的IT人才补给成本也更低。中国数智融合发展背景1企业数智融合的痛点及应对2数智融合典型实践3数据量和非结构化数据占比上升统一管理,统一查询使用,成为新的挑战全球数据量以59%以上的年增长率快速增长,其中80%是非结构化和半结构化数据,中国数据量的上升较全球更为迅速。 数据量和非结构化数据的上升,使得基于对象存储的数据湖越来越为普及。此时,如何使用统一管理,统一查询使用,成 为新的挑战。2015-2030年中国数据量规模及全球占比企业内结构化数据与非结构化数据占比及使用情况结构化 数据,在企业的数据中,结构化数据28.8%27.8%20%175仅占20%,其余80%都是以文 件、语音、图片等形式存在的 非结构化数据。且非结构化数 据的增速远远高于结构化数据, 随着时间的推移,非结构化数据 所占的比例将会越来越高。非结构化 非结构化数23.6%23.2%据, 30%数据, 80%49企业长期以来,受技术影响, 对结构化数据的利用率均高 于对非结构化数据的利用率。 但实际上,非结构化数据的 体量与其包含的信息量都更 多,是企业未得到充分利用 的宝贵资产。12结构化 数据, 70%32015 2020中国年数据量(ZB)2025e 2030e中国年数据量全球占比(%)来源:中国电信招股说明书,艾瑞咨询研究院整理及绘制。数据多源异构成为常态数据从“汇聚才可被用”到“链接即可被用”在传统数仓中,多源数据经ETL过程并集中入仓,方可被使用。该方式有许多不足:第一,因有复杂的ETL过程及大量数 据的传输,数据实时性难以保障,因此分析常必须T+1才可完成;第二,数据的全量存储和存储成本之间难以取舍,因此 必须提前抉择保留哪些数据,随着数据种类的逐渐增多,这很难做到;第三,对于异常值的下钻、回溯等,无法回溯到最 为原始的数据。随着应用场景的增多,数据库的种类也逐渐丰富,如更适应物联网场景的时序数据库、更适应知识谱图应 用的图数据库,等等。综上,多源异构、分布存储、现用现传、统一查询与应用的架构,逐渐被敏捷型企业认可。数据仓库vs数据湖vs湖仓一体 数据库的多源性BI 报表 ……BI报表……接口ETL统一资源池数据仓库结构化/半 结构化数据计算层计算层一站式数据库管理存储层存储层数 据 处 理存算分离,弹性扩展BI报表安全性非关系型……Reids部署 性能容量资源管理 监控巡检 高可用关系型结构化/半 结构化/非 结构化数据数据湖……开源数仓集群 数湖集群Open GaussOraclePostgre SQLMySQLDB2 达梦数据湖vs湖仓一体数据仓库vs湖仓一体“湖仓一体”弥补Hadoop下 数据湖实时数据处理的缺失, 降低事后数据治理难度,提升 了大数据应用性能。“湖仓一体”作为数据处理统 一底座,提供实时处理多引擎、 多数据类型能力,避免数据移 动建模,降低数据处理的成本。公有云1公有云2私有云物理机虚拟机大数据的5V价值有待进一步释放可从平台性工具入手,进而解决思维和技能的问题大数据产业作为以数据生成、采集、存储、加工、分析、服务为主的战略性新兴产业,提供全链条技术、工具和平台,孕 育数据要素市场主体,深度参与数据要素全生命周期活动,是激活数据要素潜能的关键支撑,是数据要素市场培育的重要 内容。目前,大数据产业仍存在数据壁垒突出、碎片化问题严重等瓶颈约束,大数据容量大、类型多、速度快、精度准、 价值高的5V特性未能得到充分释放。这其中既有思维、技能的要素,又有工具的要素,三者也并非割裂存在,一般来说, 性能稳定、简单易用的全链条平台工具有助于消除思维的“不敢”和技能的“不会”,化解掉5V特性释放的原始阻力,使 得大数据更加普适化。大数据5V特性速度(Velocity)数量(Volume)批处理实时多进程数据流TB级记录/日志事务表文

文档评论(0)

535600147 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:6010104234000003

1亿VIP精品文档

相关文档