TCESA-2024-252《人工智能 国资央企通用大模型评测要求 第1部分:语言大模型》编制说明.pdfVIP

TCESA-2024-252《人工智能 国资央企通用大模型评测要求 第1部分:语言大模型》编制说明.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

中国电子工业标准化技术协会

团体标准《人工智能国资央企通用大模型评测要求第1部

分:语言大模型》(征求意见稿)

编制说明

一、工作简况

根据中国电子工业标准化技术协会2024年第十二批团体标准制修订项目通

知,中国移动通信有限公司研究院负责《人工智能国资央企通用大模型评测要

求第1部分:语言大模型》(中电标通【2024】031号,项目编号:CESA-2024-252)

标准的制定工作。本标准由中国移动通信有限公司研究院提出,由中国电子技术

标准化研究院、中国电子工业标准化技术协会归口。标准起草单位为中国移动通

信有限公司研究院、中国电子技术标准化研究院、中国电信股份有限公司研究院

等。

本标准的起草过程简述如下:

2024年9月,中国移动通信有限公司研究院牵头组织有关单位,在北京召

开了本标准的立项筹备会。会议共有来自中国移动通信集团有限公司研究院、中

国电子技术标准化研究院、中国电信集团有限公司研究院、中石油(北京)数智

研究院有限公司、中国电力科学研究院有限公司、中国物流集团有限公司、重庆

长安汽车股份有限公司、北京百度网讯科技有限公司、阿里云计算有限公司、科

大讯飞股份有限公司、北京市商汤科技开发有限公司、复旦大学、北京邮电大学

等13家单位的13位专家,对该标准的立项达成共识,共同收集相关资料,形成

标准草案大纲。

2024年9月~2024年11月,标准编制组多次邀请人工智能大模型专家进行

讨论,对标准草案的技术内容和格式进行修改完善,同时向相关单位和专家发送

邮件,征求相关单位的意见和建议。针对搜集到的意见和建议,标准编制组进行

了深入细致的研讨,形成了《人工智能国资央企通用大模型评测要求第1部分:

语言大模型》标准草案。

2024年11月28日,中国电子工业标准化技术协会组织有关单位,在北京

中国电子工业标准化技术协会

召开了本标准的立项论证会。本次会议共有来自北京大学、华北电力大学、北京

邮电大学、北京百度网讯科技有限公司等5家单位的5名专家,对本标准进行了

立项论证。专家组一致建议标准发起单位完善标准立项建议书,尽快报请协会立

项。该标准于2023年11月正式立项。

会后,标准起草工作组多次召开了标准讨论会,对专家提出的意见、建议进

行了认真分析和总结,并进一步修改和完善标准草案,于2024年12月形成标准

征求意见稿。

二、标准编制原则和确定主要内容的论据及解决的主要问题

本标准的制定工作遵循“统一性、协调性、适用性、一致性、规范性”的原

则,本着先进性、科学性、合理性和可操作性的原则,按照GB/T1.1-2020《标

准化工作导则第1部分:标准化文件的结构和起草规则》给出的规则编写。

本标准中主要内容规定了语言大模型评测框架、评测对象、评测维度、评测

任务和评测要素。

本标准适用于指导语言大模型研发和大模型能力评估,依据是国资央企通用

大模型研发和应用的现状调研,包括中国移动九天大模型、中国电信星辰大模型、

百度文心一言大模型、阿里通义千问大模型及科大讯飞星火大模型等几十款通用

大模型。

本标准解决的主要问题,是随着大模型技术的广泛应用,需要对通用大模型

的评测要求进行统一规范,为通用大模型相关的产品和服务提供评测的依据,以

评估大模型广泛应用于各类生产、生活任务时适用性和可行性,提高大模型选型

决策的效率和准确性。

三、主要试验[或验证]情况分析

本标准研制过程中,编制组结合中国移动已开展的大模型评测结果整体水平

数据,以及国资央企通用大模型技术和产品发展现状,论证技术要求指标设定合

理性。

四、知识产权情况说明

本标准不涉及知识产权。

五、产业化情况、推广应用论证和预期达到的经济效果

中国电子工业标准化技术协会

国资央企通用大模型凭借其较强的信息处理能力和广泛的知识覆盖度,已展

现出较大的应用潜力,相关产品正逐步成为推动各行业数字化转型与智能化升级

的关键力量。当前,为加速通用大模型的建设进程,迫切需要建立通用大模型评

测标准。该标准将用于指导国资央企通用大模型的能力测试工作,并为其开发迭

代优化提供依据,进而有效提升日常生产、生活的智能化水平,加速推动千行百

业的数字化转型和智能化升级。

六、转化国际标准和国外先进标准情况

无。

七、与现行相

文档评论(0)

***** + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8135026137000003

1亿VIP精品文档

相关文档