网站大量收购闲置独家精品文档,联系QQ:2885784924

前沿大模型的风险、安全与治理报告(2023).docx

前沿大模型的风险、安全与治理报告(2023).docx

  1. 1、本文档共126页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

本报告的讨论范围专?AI(NarrowAI)通?AI(

本报告的讨论范围

专?AI(NarrowAI)通?AI(GeneralAI)

2

伤害

讨论范围

潜在

具有危险能?的专?AI

具有危险能?的专?AI

(例如?于?络攻击、?物?程

的AI模型)

前沿AI(Frontier

前沿AI(FrontierAI)

(例如前沿?模型,以及未来可

能的AGI)

次前沿的基础模型(例如GPT-3)

次前沿的基础模型

(例如GPT-3)

低?险的专?系统

(例如AlphaGo、AlphaFold)

通?性

注:1)本报告的讨论范围参考了全球AI安全峰会的讨论范围设定,??书得到图灵奖得主YoshuaBengio等学者专家的建议。

2)在不同章节,根据参考资料或讨论语境,前沿?模型、前沿AI、AGI等概念可能存在混?的情况。

术语定义

本报告聚焦?前沿?模型:

●前沿?模型(FrontierLargeModel):能执??泛的任务,并达到或超过当前最先进现有模型能?的?规模机器学习模型,是?前最常?的前沿AI,提供了最多的机遇但也带来了新的?险。

模型能?相关术语,主要参考全球AI安全峰会、前沿模型论坛、AI全景报告:

●前沿AI(FrontierAI):?能?的通?AI模型,能执??泛的任务,并达到或超过当今最先进模型的能?,最常?的是基础模型。

●通?AI(GeneralAI)/专?AI(NarrowAI):?种设计?来执?任何/特定认知任务的??智能,其学习算法被设计为可以执?各种各样的任务/少数特定任务,并且从执?任务中获得的知识可以/不可以?动适?或迁移到其他任务。

●通???智能(Arti?cialGeneralIntelligence,AGI):可在所有或?部分有经济价值的任务中达到或超过?类全部认知能?的机器智能。(与通?AI的区别在于能?级别;关于AGI的定义存在很多分歧,本报告中不同专家或调研的定义可能不同)

?规模机器学习模型相关术语,主要参考斯坦福?学、智源研究院:

●基础模型(FoundationModel):在?规模?泛数据上训练的模型,使其可以适应?泛的下游任务;国内学界外通常简称为“?模型”。

??智能?险相关术语,主要参考?津?学研究机构:

●?存?险(ExistentialRisk):威胁起源于地球的智能?命过早灭绝或对其未来发展潜?的永久和剧烈破坏的?险。

●灾难性?险(CatastrophicRisk):?种可能发?的事件或过程,若发?将导致全球约10%或更多??丧?,或造成类似损害。

3

3

报告?录

?前沿?模型的趋势预测:技术解读|扩展预测?前沿?模型的?险分析:?险态度|?险解读

三前沿?模型的安全技术:对?|监测|鲁棒性|系统性安全四前沿?模型的治理?案:技术治理|政府监管|国际治理

五总结和展望

4

4

?前沿?模型的趋势预测

5

5

?前沿?模型的趋势预测:技术解读

?前沿?模型的趋势预测:技术解读|扩展预测

6

涌现能?是指这些能?并没有被开发者显式地设计,?是由于其规模庞?,在训练过程中会?然?然地获得的;并且,这些前沿?模型已在?系列的专业和学术基准逼近?类?平。

●微软研究院的定性研究认为GPT-4显?出AGI的?花:

。“GPT-4的能?,我们认为它可以被合理地视为早期(但仍不完善)版本的AGI。”

。“新能?的影响可能导致就业岗位的更迭和更?泛的经济影响,以及使恶意?为者拥有新的误导和操纵?具;局限性??,系统可靠性的缺陷及其学习的偏?可能会导致过度依赖或放?现有的社会问题。”

●图灵奖得主YoshuaBengio认为GPT-4已经通过图灵测试:

。“我最近签署了?封公开信,要求放慢?GPT-4更强?的巨型??智能系统的开发速度,这些系统?前通过了图灵测试,因此可以欺骗?类相信它正在与同伴?不是机器进?对话。”

。“正是因为出现了意想不到的加速??年前我可能不会签署这样的?封信?所以我们需要后退?步,?我对这些话题的看法也发?了变化。”

专业和学术基准

专业和学术基准

GPT-4SystemCard(OpenAI,2023)

Emergentabilitiesoflargelanguagemodels(Wei,2022)

?前沿?模型的趋势预测:

?前沿?模型的趋势预测:技术解读|扩展预测

7

?语?模型(LLM)的理解和推理等能?推动了众多技术?

文档评论(0)

4A方案 + 关注
实名认证
服务提供商

擅长策划,|商业地产|住房地产|暖场活动|美陈|圈层活动|嘉年华|市集|生活节|文化节|团建拓展|客户答谢会

1亿VIP精品文档

相关文档