- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
计算机研究与发展DOI:10.7544/issn1000-1239.p
“大模型道德价值观对齐问题剖析”评述60(9):1925−1925,2023
重视大模型风险,发展负责任AI
周明
(北京澜舟科技有限公司北京100081)
人工智能(AI)的发展经历了符号系统、基于统计的机器学习之后,进入了深度学习阶段.
在
2017年Transformer出现之后进入了快速发展期,先后出现了GPT、BERT、T5等基于自监督学习的预训
练模型,并兴起了预训练模型基础上的微调范式.
随后以ChatGPT为标志,在预训练模型中加入了有监
督的微调和基于人类反馈的强化学习,AI进入了大模型时代.
AI模型和系统在参数量、任务性能、应用
场景等方面都实现了飞跃式的突破.
在海量数据上训练的百亿、千亿乃至万亿参数规模的大模型,具备
了少样本学习、推理解释和对话式交互的能力,在多任务上展现了接近甚至超过人类水平的通用能力,
向着通用AI迈出了第一步.
技术的发展总是具有双面性,划时代的突破也带来了对少数群体的歧视、隐私泄露、版权侵害、误
导性信息、恶意滥用等问题,并可能对用户乃至整个社会造成偏见、不平等等深远的负面影响.
在大模
型的快速发展过程中,我们不仅要不断推动基础技术的进步,而且必须考虑到对社会可能带来的风险
和潜在的负面影响,引导AI的发展遵循负责任和守道德的准则,使得AI技术真正成为人类社会可持
续发展的助力.
基于大模型的能力和风险,有必要重新梳理和审视这些模型,尤其是与大模型结合的对齐技术如何能够实
现负责任的发展.
当下国内针对大模型的研究还处于基础技术快速发展和追赶的阶段,对大模型的风
险和道德问题重视不够.
难能可贵的是,微软亚洲研究院谢幸团队注意到了大模型潜在的道德问题,并
向大模型的道德价值观对齐的研究迈出了重要一步.
该团队撰写的文章“大模型道德价值观对齐问题
剖析”作为一篇综述性和展望性的文章,介绍了目前大模型,尤其是大语言模型发展过程中面临的道德
风险与挑战,梳理了当下大模型对齐方法的特点与不足,并提出了一种新的针对道德对齐的概念性框
架.
该文的贡献与亮点主要有以下4点:
1.
大模型的特点与风险梳理.
文章全面概述了大模型的特点,强调了伴随尺度定律和能力涌现而
来的反尺度现象和风险涌现,这将会放大模型带来的安全和道德问题.
随后文章详细梳理了模型面临
的风险挑战,有助于理解和分析大模型可能对社会产生的潜在影响和后果.
2.
AI伦理准则调研和评估.
文章调研了现有的AI伦理准则,批判性地评估了它们解决大模型伦理
影响方面的适用性.
通过审视现有的规范准则,文章基于康德的规范伦理学理论,提出了“AI绝对命令”
框架用以重新评估各项准则,并强调了学术界合作建立统一普适的AI伦理框架方面的重要性.
3.
大模型道德倾向分析及对齐方法综述.
文章运用道德基础理论测试了主流大语言模型的道德倾向,
提供了关于模型中编码的道德观的洞察,突显了潜在的偏见与不足.
随后,文章系统性地介绍了现有大模
型对齐算法,总结了道德价值观对齐所面临的独特问题.
4.
伦理对齐的新范式.
文章基于道德学理论引入了一个新颖的概念性范式,用于对齐大模型的道
德观.
从大模型对齐的维度、对齐的评测以及对齐的方法等3个方面为解决道德对齐所带来的挑战提
供了新的方法,为进一步的跨学科研究开辟了道路.
我认为这篇展望性文章不仅体现了对AI大模型研究前沿全面的了解和深入的思考,而且具备了
很强的交叉学科特征.
该文详细介绍并充分借鉴了社会科学和道德学等领域的理论基础,弥补了计算
机领域学者在这方面的不足,为大模型的道德对齐打开了一个全新的视角.
相信这篇文章既能为AI领
域的研究者,又能为交叉学科领域的学者乃至政策制定者提供有益的参考.
希望有关方面更多地关注
这一重要的问题,重视大模型的伦理和道德风险
- 乡村振兴、双碳、储能、绿色金融 + 关注
-
实名认证服务提供商
新能源知识科普(本账号发布文档均来源于互联网公开资料,仅用于技术分享交流,相关版权为原作者所有。如果侵犯了您的相关权利,请提出指正,我们将立即删除相关资料)。
文档评论(0)