北京市促进通用人工智能创新发展措施.pdfVIP

北京市促进通用人工智能创新发展措施.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

北京市促进通用人工智能创新发展的

若干措施(2023-2025年)

(征求意见稿)

为抢抓大模型发展机遇,重视通用人工智能发展,充分发挥

政府引导作用和创新平台催化作用,整合创新资源,加强要素配

置营造创新生态,重视风险防范,推动我市通用人工智能领域

实现创新引领,提出以下落实措施:

一、加强算力资源统筹供给能力

(一)组织商业算力定向满足本市紧迫需求

加强与头部公有云厂商等市场主体合作实施算力伙伴计划

并确定首批伙伴计划成员明确供给技术准、软硬件服务要求、

算力供给规模、优惠策略等,向在京高校院所和中小企业公布一

批优质算力供应商。

(二)高效推动新增算力基础设施建设

将新增算力建设项目纳入算力伙伴计划,加快推动海淀区“

北京人工智能公共算力平台”朝阳区“北京数字经济算力中心”等

项目建设,快速形成规模化先进算力供给能力,支撑千亿级参数

量的大型语言模型、多模态大模型、大规模精细神经网络模拟仿

真模型、脑启发神经网络等研发。

(三)建设统一的多云算力调度平台

1

-1-

利用政府统一入口,降低公有云采购成本,普惠中小企业

同时减少企业分别面对不同云厂商的沟通成本。针对弹性算力

需求建设统一的多云算力调度平台实现异构算力环境统一管理

、统一运营,方便企业在不同云环境上无缝、经济、高效地运行各

类人工智能计算任务。建设北京与河北、天津、山西、内蒙古等

省(市)算力集群的直连基础光传输网络进一步提升平台对四地

算力资源感知能力探索开展算力交易。

二、提升高质量数据要素供给能力

(四)归集高质量基础训练数据集

针对目前大模型训练高质量中文语料占比过少,不利于中

文语境表达及产业应用的问题,整合现有开源中文预训练数据

集和高质量互联网中文数据并进行合规清洗。同时持续扩展高

质量多模态数据来源,建设合规安全的中文、图文对、音频、视

频等大模型预训练语料库,通过北京国际大数据交易所社会数

据专区进行定向有条件开放。

(五)打造“国家数据基础制度先行先试示范区”谋划国家级数

据训练基地

加快推动数据要素高水平开放的“国家数据基础制度先行先

试示范区”建设,争创国家级数据训练基地,提升北京人工智能

数据注库规模和质量。倡议高质量数据网站所属企业提供部分

脱敏高质量数据进行定向有条件开放,企业或科研机构通过在

2

-2-

线申请进行有偿使用,并探索基于数据贡献、模型应用的商业化

场景合作。

(六)搭建数据集精细化注众包服务平台

建设指令数据集及多模态数据集众包服务平台,开发集成

相关工具应用的智能云服务系统,鼓励并组织来自不同学科的

专业人员注通用人工智能模型训练数据及指令数据,提高训

练数据的多样性给予贡献者适当奖励,推动平台持续良性发展

三、系统布局大模型技术体系,持续探索通用人工智能路

(七)开展大模型创新算法及关键技术研究

围绕大型语言模型构建、训练、调优对齐、推理部署等全流

程,支持开展创新算法及核心技术研究,形成完整高效的训练体

系并对外开源。探索多模态通用模型架构,研究大模型高效并行

训练技术,以及逻辑和知识推理、指令学习、人类意图对齐等调优

方法研发支持百亿参数模型推理的高效压缩技术。

(八)加强大模型训练数据采集及治理工具研发

从“采、存、管、研、用”五个方面,研发包含数据采集、清洗、

注、脱敏、存储等功能在内的数据处理工具。重点研究互联网

数据全量实时更新技术,多源异构数据整合与分类方法,数据管

理平台相关系统数据清洗、注、分类、注释等软件工具及算法

数据内容安全审查算法及工具等。

文档评论(0)

wsb + 关注
实名认证
文档贡献者

学生

1亿VIP精品文档

相关文档