前沿大模型的风险、安全与治理报告（2023）.docx

下载文档

0
0
约6.23万字
约 126页
2024-12-25 发布于山西
举报
版权申诉
保障服务

前沿大模型的风险、安全与治理报告（2023）.docx

1、本文档共126页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

本报告的讨论范围专?AI(NarrowAI)通?AI(

本报告的讨论范围

专?AI(NarrowAI)通?AI(GeneralAI)

伤害

讨论范围

潜在

具有危险能?的专?AI

(例如?于?络攻击、?物?程

的AI模型)

前沿AI(Frontier

前沿AI(FrontierAI)

(例如前沿?模型，以及未来可

能的AGI)

次前沿的基础模型(例如GPT-3)

次前沿的基础模型

(例如GPT-3)

低?险的专?系统

(例如AlphaGo、AlphaFold)

通?性

注：1)本报告的讨论范围参考了全球AI安全峰会的讨论范围设定，??书得到图灵奖得主YoshuaBengio等学者专家的建议。

2)在不同章节，根据参考资料或讨论语境，前沿?模型、前沿AI、AGI等概念可能存在混?的情况。

术语定义

本报告聚焦?前沿?模型：

●前沿?模型(FrontierLargeModel)：能执??泛的任务，并达到或超过当前最先进现有模型能?的?规模机器学习模型，是?前最常?的前沿AI，提供了最多的机遇但也带来了新的?险。

模型能?相关术语，主要参考全球AI安全峰会、前沿模型论坛、AI全景报告：

●前沿AI(FrontierAI)：?能?的通?AI模型，能执??泛的任务，并达到或超过当今最先进模型的能?，最常?的是基础模型。

●通?AI(GeneralAI)/专?AI(NarrowAI)：?种设计?来执?任何/特定认知任务的??智能，其学习算法被设计为可以执?各种各样的任务/少数特定任务，并且从执?任务中获得的知识可以/不可以?动适?或迁移到其他任务。

●通???智能(Arti?cialGeneralIntelligence,AGI)：可在所有或?部分有经济价值的任务中达到或超过?类全部认知能?的机器智能。(与通?AI的区别在于能?级别；关于AGI的定义存在很多分歧，本报告中不同专家或调研的定义可能不同)

?规模机器学习模型相关术语，主要参考斯坦福?学、智源研究院：

●基础模型(FoundationModel)：在?规模?泛数据上训练的模型，使其可以适应?泛的下游任务；国内学界外通常简称为“?模型”。

??智能?险相关术语，主要参考?津?学研究机构：

●?存?险(ExistentialRisk)：威胁起源于地球的智能?命过早灭绝或对其未来发展潜?的永久和剧烈破坏的?险。

●灾难性?险(CatastrophicRisk)：?种可能发?的事件或过程，若发?将导致全球约10%或更多??丧?，或造成类似损害。

报告?录

?前沿?模型的趋势预测：技术解读｜扩展预测?前沿?模型的?险分析：?险态度｜?险解读

三前沿?模型的安全技术：对?｜监测｜鲁棒性｜系统性安全四前沿?模型的治理?案：技术治理｜政府监管｜国际治理

五总结和展望

?前沿?模型的趋势预测

?前沿?模型的趋势预测：技术解读

?前沿?模型的趋势预测：技术解读｜扩展预测

涌现能?是指这些能?并没有被开发者显式地设计，?是由于其规模庞?，在训练过程中会?然?然地获得的；并且，这些前沿?模型已在?系列的专业和学术基准逼近?类?平。

●微软研究院的定性研究认为GPT-4显?出AGI的?花：

。“GPT-4的能?，我们认为它可以被合理地视为早期(但仍不完善)版本的AGI。”

。“新能?的影响可能导致就业岗位的更迭和更?泛的经济影响，以及使恶意?为者拥有新的误导和操纵?具；局限性??，系统可靠性的缺陷及其学习的偏?可能会导致过度依赖或放?现有的社会问题。”

●图灵奖得主YoshuaBengio认为GPT-4已经通过图灵测试：

。“我最近签署了?封公开信，要求放慢?GPT-4更强?的巨型??智能系统的开发速度，这些系统?前通过了图灵测试，因此可以欺骗?类相信它正在与同伴?不是机器进?对话。”

。“正是因为出现了意想不到的加速??年前我可能不会签署这样的?封信?所以我们需要后退?步，?我对这些话题的看法也发?了变化。”

专业和学术基准

GPT-4SystemCard(OpenAI,2023)

Emergentabilitiesoflargelanguagemodels(Wei,2022)

?前沿?模型的趋势预测：

?前沿?模型的趋势预测：技术解读｜扩展预测

?语?模型(LLM)的理解和推理等能?推动了众多技术?

您可能关注的文档

文档评论（0）

4A方案 + 关注: 实名认证

服务提供商

擅长策划，|商业地产|住房地产|暖场活动|美陈|圈层活动|嘉年华|市集|生活节|文化节|团建拓展|客户答谢会

咨询作者（1389人已咨询）已休息

1亿VIP精品文档

更多 >

前沿大模型的风险、安全与治理报告（2023）.docx