2025_十五五_时期数据资源高效流通利用研究报告_49页_3mb.docxVIP

2025_十五五_时期数据资源高效流通利用研究报告_49页_3mb.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

“十五五”时期

数据资源高效流通利用研究报告

——加速分布式存储全闪化,构建高质量AI数据基础设施

中国计算机行业协会数据流通利用专业委员会中国电子工业标准化技术协会数据存储专业委员会

下一代互联网关键技术和评测国家地方联合工程研究中心中国软件评测中心

北京赛迪认证中心有限公司

2025年11月

版权声明

本报告版权属于中国计算机行业协会数据流通利用专业委员会(简称“数利委”)、中国电子工业标准化技术协会数据存储专业委员会(简称“数据存储专委会”)、下一代互联网关键技术和评测国家地方联合工程研究中心(简称“下一代互联网国家工程中心”)、中国软件评测中心(简称“中国评测”)、北京赛迪认证中心有限公司(简称“赛迪认证”),并受法律保护。转载、摘编或利用其它方式使用本报告文字或者观点的,应注明“来源:数利委、数据存储专委会、下一代互联网国家工程中心、中国评测、赛迪认证”。违反上述声明者编者将追究其相关法律责任。

引言

数据已成为关键生产要素。在数字经济时代,数据作为与传统生产要素(土地、劳动力、资本、技术)并列的新型要素,其价值本质在于通过汇聚、加工和应用,优化资源配置、提升生产效率并创造经济价值。这一地位的确立源于数据在经济社会发展中的核心驱动作用,它不仅是信息社会的基础资源,更是推动新质生产力发展的核心引擎。

习近平总书记指出,数据是数字经济时代的基础性资源、重要生产力和关键生产要素。近年来大模型技术不断取得突破,大规模高质量训练数据的投入在其中起到了关键作用,也进一步将“以数据为中心的人工智能”推向一个新阶段。

在国家层面,以《中共中央国务院关于构建数据基础制度更好发挥数据要素作用的意见》(“数据二十条”)为核心框架的数据基础制度体系已经构建。该体系围绕数据产权、流通交易、收益分配、安全治理四大支柱深化制度建设,旨在激活数据要素潜能并规范市场秩序。这一“四梁八柱”式的制度设计,正从政策框架向实操落地转化,为数字中国建设筑牢制度根基。

“十五五”时期(2026—2030年),推动数据资源高效流通利用具有显著紧迫性。一要突破经济增长瓶颈。通过数

据流通优化资源配置,提升全要素生产率,显著降低传统要素(资本、劳动力)错配成本。二要满足新质生产力培育的迫切需求。人工智能、生物育种等战略新兴产业依赖高质量数据融合;数据流通滞后将直接阻碍大模型训练、新材料研发等关键创新进程,削弱国际竞争力。三要破解数据要素市场化改革的深层次梗阻。权属界定模糊导致企业“不敢流通”等制度性堵点亟待疏通;数据跨境流动、隐私保护等风险尚未建立系统化治理框架;安全与效率的平衡面临挑战。四要抓住全球竞争格局重构的战略窗口期。加速应对以美国为首的数据跨境流动规则体系,提升我国数据跨境流通能力与数字贸易规则话语权。因此,“十五五”时期需以流通效率跃升为核心突破口,系统破解制度、技术、安全三重约束。

AI大模型爆发对数据流通利用提出新挑战。AI时代对数据处理的规模与速度要求实现了数量级的跃升,且数据呈现出巨量小文件、单一目录海量文件等独特特征;CPU、网络的新发展也需要全新软件的匹配,这都对面向AI时代的分布式文件系统提出了新挑战。伴随千行百业的数字化转型迈向深水区,AI、HPC、大数据等新型关键应用正加速融入企业生产决策系统,其对业务体验和底座支撑的要求也水涨船高,既有的存储产品及解决方案难免捉襟见肘。尤值一提的是,生成式AI浪潮打开了“潘多拉魔盒”,激活了视频、语音、文本、图片等海量非结构化数据的潜能。很多企业数

据中心汇聚了不同应用的多种类、多格式、多协议数据,这对实时分析、智能决策、节能减碳提出前所未有的挑战,以存力变革推动数据服务跃迁势在必行。

本报告着眼于健全AI领域数据资源高效流通利用的政策措施,提出适应AI应用的数据资源高效流通利用技术路径,打造高性能分布式存储全闪化数据基础设施底座,健全精准高效的数据管理体系,构建智能化、一体化的数据流通利用平台,深化AI领域数据资源高效流通利用场景,促进数据高质量供给、高效流通利用,降低社会用数成本和用数门槛,赋能实体经济,促进社会高质量发展,打造国际竞争新优势,构建“数据要素×人工智能”双向赋能的发展格局。

目录

一、AI领域数据资源高效流通利用概述 1

(一)数据资源高效流通利用的基本概念 1

(二)高质量数据集的基本概念 7

(三)适应人工智能(AI)应用数据基础设施概述 8

(四)“十五五”时期数据资源流通利用趋势研判 12

二、我国AI领域数据资源高效流通利用面临三大挑战 15

(一)数据资源高效流通利用的社会环境仍需改善 15

(二)数据资源高效流通利用的技术体系有

您可能关注的文档

文档评论(0)

shenv + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档