- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
北京市促进通用人工智能创新发展的
若干措施(2023-2025年)
(征求意见稿)
为抢抓大模型发展机遇,重视通用人工智能发展,充分发挥
政府引导作用和创新平台催化作用,整合创新资源,加强要素配
置营造创新生态,重视风险防范,推动我市通用人工智能领域
实现创新引领,提出以下落实措施:
一、加强算力资源统筹供给能力
(一)组织商业算力定向满足本市紧迫需求
加强与头部公有云厂商等市场主体合作实施算力伙伴计划
并确定首批伙伴计划成员明确供给技术准、软硬件服务要求、
算力供给规模、优惠策略等,向在京高校院所和中小企业公布一
批优质算力供应商。
(二)高效推动新增算力基础设施建设
将新增算力建设项目纳入算力伙伴计划,加快推动海淀区“
北京人工智能公共算力平台”朝阳区“北京数字经济算力中心”等
项目建设,快速形成规模化先进算力供给能力,支撑千亿级参数
量的大型语言模型、多模态大模型、大规模精细神经网络模拟仿
真模型、脑启发神经网络等研发。
(三)建设统一的多云算力调度平台
1
-1-
利用政府统一入口,降低公有云采购成本,普惠中小企业
同时减少企业分别面对不同云厂商的沟通成本。针对弹性算力
需求建设统一的多云算力调度平台实现异构算力环境统一管理
、统一运营,方便企业在不同云环境上无缝、经济、高效地运行各
类人工智能计算任务。建设北京与河北、天津、山西、内蒙古等
省(市)算力集群的直连基础光传输网络进一步提升平台对四地
算力资源感知能力探索开展算力交易。
二、提升高质量数据要素供给能力
(四)归集高质量基础训练数据集
针对目前大模型训练高质量中文语料占比过少,不利于中
文语境表达及产业应用的问题,整合现有开源中文预训练数据
集和高质量互联网中文数据并进行合规清洗。同时持续扩展高
质量多模态数据来源,建设合规安全的中文、图文对、音频、视
频等大模型预训练语料库,通过北京国际大数据交易所社会数
据专区进行定向有条件开放。
(五)打造“国家数据基础制度先行先试示范区”谋划国家级数
据训练基地
加快推动数据要素高水平开放的“国家数据基础制度先行先
试示范区”建设,争创国家级数据训练基地,提升北京人工智能
数据注库规模和质量。倡议高质量数据网站所属企业提供部分
脱敏高质量数据进行定向有条件开放,企业或科研机构通过在
2
-2-
线申请进行有偿使用,并探索基于数据贡献、模型应用的商业化
场景合作。
(六)搭建数据集精细化注众包服务平台
建设指令数据集及多模态数据集众包服务平台,开发集成
相关工具应用的智能云服务系统,鼓励并组织来自不同学科的
专业人员注通用人工智能模型训练数据及指令数据,提高训
练数据的多样性给予贡献者适当奖励,推动平台持续良性发展
。
三、系统布局大模型技术体系,持续探索通用人工智能路
径
(七)开展大模型创新算法及关键技术研究
围绕大型语言模型构建、训练、调优对齐、推理部署等全流
程,支持开展创新算法及核心技术研究,形成完整高效的训练体
系并对外开源。探索多模态通用模型架构,研究大模型高效并行
训练技术,以及逻辑和知识推理、指令学习、人类意图对齐等调优
方法研发支持百亿参数模型推理的高效压缩技术。
(八)加强大模型训练数据采集及治理工具研发
从“采、存、管、研、用”五个方面,研发包含数据采集、清洗、
注、脱敏、存储等功能在内的数据处理工具。重点研究互联网
数据全量实时更新技术,多源异构数据整合与分类方法,数据管
理平台相关系统数据清洗、注、分类、注释等软件工具及算法
数据内容安全审查算法及工具等。
您可能关注的文档
最近下载
- 【行业标准】T∕CHES 17-2018 水井报废与处理技术导则.pdf VIP
- 2024-2025学年初中音乐七年级上册(2024)人音版(2024)教学设计合集.docx
- 2023年《工程项目精细化管理手册》.doc VIP
- 中心静脉血管通路装置安全管理专家共识.pptx
- SY/T 6610-2017 硫化氢环境井下作业场所作业安全规范.pdf VIP
- 教师资格定期注册申请表.doc
- 五年级上数学说课稿分数的再认识_北师大版.docx VIP
- 8.3 区域性国际组织 课件-高中政治统编版选择性必修一当代国际政治与经济.pptx
- 2024-2025学年广东省深圳市南山实验教育集团七年级上学期期中数学试卷及参考答案.docx VIP
- 五年级上数学说课稿分数的再认识_北师大版.pdf VIP
文档评论(0)