AI可信数据空间白皮书-.pptxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

践行深度用云

AI可信数据空间

白皮书;

贵州省数据流通交易服务中心

贵州大数据集团

贵州贵旅数网科技有限公司华为云计算技术有限公司

(排名不分先后)

朱宗尧徐昊张广肖霏

潘伟杰金凯艾晓松胡琼元黄籽渝

赵将吕东宋雪胡鹤袁波吴越邓龙江刘志杰刘泥君代新敏王似巍冯俊峰吴忠林李勇龙婕杨文敬张洪能尹舒鹤李媛杨松张中黄涛陈媛黄松杨舒宁徐强徐俊悦怡张志刚霍战鹏邝逸鹤周岩王立乔丽娜陈勇邴丽孙梦龙陈玙杨梦辉唐如兵雷鸿伟郑辉张小军柏君孙思东张鑫洁唐文张溯陈吉栋叶飞白文武何志强

(排名不分先后);

CONTENTS;

1、贵州大数据集团公共数据授权运营空间实践

2、贵州省文旅行业数据空间及大模型实践

3、上海数据集团城市数据空间实践

4、深圳南山数据可信流通服务探索实践

5、华为企业数据空间探索实践;

前言

PREFACE;

构建可信数据空间与人工智能协同创新范式,开启人工智能新时代。

在数字文明加速迭代进化的时代洪流中,数据与人工智能共生发展正重塑全球经济的格

局。数据作为我国第五大生产要素,其价值释放的深度与广度,直接决定了人工智能产

业从“感知智能”向“认知智能”跃迁的新高度。当前全球数据总量虽呈指数级增长(2023

年突破175ZB),但高质量语料尤其是中文语料严重匮乏,实际流通率却不足5%。数据

产业面临“不敢共享、不愿共享、不能共享”的困局如同无形枷锁禁锢着AI创新的步伐。

比如医疗数据因隐私顾虑难以赋能疾病预测模型,工业数据因竞争壁垒阻碍供应链协

同优化,金融数据因权属模糊制约风险管控精度,这些挑战的本质,是数据要素市场化

配置过程中“信任基础”的不足,也将严重制约着人工智能产业的发展。

国家数据局重磅出台《可信数据空间发展行动计划(2024—2028年)》,以国家战略方

式推动可信数据空间的加速建设,预计2028年国内将建成100个以上可信数据空??,

包括城市、行业、企业、个人、跨境五类可信空间,打通数据要素流通的“最后一公里”。在

AI时代,可信数据空间是战略级新型数据基础设施,它不是单一技术、工具的堆砌,而是

制度规则、技术架构、生态系统三位一体协同的创新范式,将成为全域数字化转型的核

心数字底座。

随着人工智能技术指数级增长,生产型AI场景爆发式应用,大模型对高质量数据的“饥

渴需求”进一步放大了可信数据空间的价值。本白皮书结合新技术的理解与创新实践的

探索,梳理可信数据空间与AI协同发展的技术路径、制度框架与实践蓝图,提出AI可

信数据空间的顶层设计与创新架构,希望借此推动产业共识,联合各界探索数据要素市

场化改革的灯塔,共同开启“数据可信即AI未来”的新纪元。;

01;;

1.2可信数据空间主要挑战

可信数据空间作为国家数据基础设施的重要组成部

分,作为全域数字化转型的新型底座通过构建安全可信的数据流通利用环境,促进数据资源的共享共用,进而释放数据要素价值。国家数据局发布行动计划明确推进企业、行业、城市、个人、跨境五类可信数据空间建设,可信数据空间建设目前还处于发展初期面临诸多堵点问题与挑战:

·挑战一、数据供给意愿不足

①权属不清与价值分配难:数据产权界定模糊,数据供给方担心共享后失去控制权或收益被稀释。例如,担忧数据泄露导致核心竞争力丧失;

②合规成本高:数据分级分类标准不统一,敏感数据(如医疗、金融)脱敏处理需专业团队,数据供给方难以承担人力与资金成本。

·挑战二、数据流通效率低

①跨域系统数据协议不统一:政府、企业、行业数据分散在异构应用系统中,数据结构、接口标准不统一,跨域流通效率低;

②安全与实时性矛盾:为满足“数据不出域、可用不可见”安全要求,隐私计算(如多方计算、同态加密、联合分析)导致计算性能延迟增加50%以上,难以支撑高价值场景(金融、物流、交通)等低时延响应要求。;

2、人工智能大模型语料发展与挑战

2.1人工智能大模型语料发展趋势

1.从大语言模型到多模态/具身智能大模型的语料演进

当前大模型技术正经历从弱人工智能(机器学习、神经网络、大语言模型)向通用人工智能(Agent、多模

文档评论(0)

哈哈 + 关注
实名认证
文档贡献者

嗨,朋友,我都会用最可爱的语言和最实用的内容,帮助你更好地理解和应对职场中的各种挑战!

1亿VIP精品文档

相关文档