重视大模型风险,发展负责任AI.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

计算机研究与发展DOI:10.7544/issn1000-1239.p

“大模型道德价值观对齐问题剖析”评述60(9):1925−1925,2023

重视大模型风险,发展负责任AI

周明

(北京澜舟科技有限公司北京100081)

人工智能(AI)的发展经历了符号系统、基于统计的机器学习之后,进入了深度学习阶段.

2017年Transformer出现之后进入了快速发展期,先后出现了GPT、BERT、T5等基于自监督学习的预训

练模型,并兴起了预训练模型基础上的微调范式.

随后以ChatGPT为标志,在预训练模型中加入了有监

督的微调和基于人类反馈的强化学习,AI进入了大模型时代.

AI模型和系统在参数量、任务性能、应用

场景等方面都实现了飞跃式的突破.

在海量数据上训练的百亿、千亿乃至万亿参数规模的大模型,具备

了少样本学习、推理解释和对话式交互的能力,在多任务上展现了接近甚至超过人类水平的通用能力,

向着通用AI迈出了第一步.

技术的发展总是具有双面性,划时代的突破也带来了对少数群体的歧视、隐私泄露、版权侵害、误

导性信息、恶意滥用等问题,并可能对用户乃至整个社会造成偏见、不平等等深远的负面影响.

在大模

型的快速发展过程中,我们不仅要不断推动基础技术的进步,而且必须考虑到对社会可能带来的风险

和潜在的负面影响,引导AI的发展遵循负责任和守道德的准则,使得AI技术真正成为人类社会可持

续发展的助力.

基于大模型的能力和风险,有必要重新梳理和审视这些模型,尤其是与大模型结合的对齐技术如何能够实

现负责任的发展.

当下国内针对大模型的研究还处于基础技术快速发展和追赶的阶段,对大模型的风

险和道德问题重视不够.

难能可贵的是,微软亚洲研究院谢幸团队注意到了大模型潜在的道德问题,并

向大模型的道德价值观对齐的研究迈出了重要一步.

该团队撰写的文章“大模型道德价值观对齐问题

剖析”作为一篇综述性和展望性的文章,介绍了目前大模型,尤其是大语言模型发展过程中面临的道德

风险与挑战,梳理了当下大模型对齐方法的特点与不足,并提出了一种新的针对道德对齐的概念性框

架.

该文的贡献与亮点主要有以下4点:

1.

大模型的特点与风险梳理.

文章全面概述了大模型的特点,强调了伴随尺度定律和能力涌现而

来的反尺度现象和风险涌现,这将会放大模型带来的安全和道德问题.

随后文章详细梳理了模型面临

的风险挑战,有助于理解和分析大模型可能对社会产生的潜在影响和后果.

2.

AI伦理准则调研和评估.

文章调研了现有的AI伦理准则,批判性地评估了它们解决大模型伦理

影响方面的适用性.

通过审视现有的规范准则,文章基于康德的规范伦理学理论,提出了“AI绝对命令”

框架用以重新评估各项准则,并强调了学术界合作建立统一普适的AI伦理框架方面的重要性.

3.

大模型道德倾向分析及对齐方法综述.

文章运用道德基础理论测试了主流大语言模型的道德倾向,

提供了关于模型中编码的道德观的洞察,突显了潜在的偏见与不足.

随后,文章系统性地介绍了现有大模

型对齐算法,总结了道德价值观对齐所面临的独特问题.

4.

伦理对齐的新范式.

文章基于道德学理论引入了一个新颖的概念性范式,用于对齐大模型的道

德观.

从大模型对齐的维度、对齐的评测以及对齐的方法等3个方面为解决道德对齐所带来的挑战提

供了新的方法,为进一步的跨学科研究开辟了道路.

我认为这篇展望性文章不仅体现了对AI大模型研究前沿全面的了解和深入的思考,而且具备了

很强的交叉学科特征.

该文详细介绍并充分借鉴了社会科学和道德学等领域的理论基础,弥补了计算

机领域学者在这方面的不足,为大模型的道德对齐打开了一个全新的视角.

相信这篇文章既能为AI领

域的研究者,又能为交叉学科领域的学者乃至政策制定者提供有益的参考.

希望有关方面更多地关注

这一重要的问题,重视大模型的伦理和道德风险

文档评论(0)

新能源知识科普(本账号发布文档均来源于互联网公开资料,仅用于技术分享交流,相关版权为原作者所有。如果侵犯了您的相关权利,请提出指正,我们将立即删除相关资料)。

1亿VIP精品文档

相关文档