- 1、本文档共7页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
·科技伦理·
人工智能价值对齐的价值表征及伦理路径人工智能价值对齐的价值表征及伦理路径
闫坤如
[摘要]人工智能价值对齐是一个规范性问题,也是个技术性问题,既需要从伦理上论证对齐的可能性和
合理性,也需要从技术上实现人工智能对齐的目标。为了实现人工智能价值对齐的目标,需要分析人工智
能价值对齐的内涵要义、明确人工智能价值对齐的价值表征,通过分析人工智能价值对齐的原则和方法,在
分析人工智能技术本性和伦理疑难的基础上,坚持人工智能在社会中的地位是一个规范性问题,而不是一
个描述性问题,是人决定人工智能技术的研发和应用,人为人工智能技术立法。此外,还需打通人工智能价
值对齐的道德规范和设计的技术标准之间的逻辑鸿沟,从技术层面和规范层面给出人工智能价值对齐的伦
理路径。
[关键词]人工智能对齐;价值对齐;价值表征
[作者简介]闫坤如,华南师范大学哲学与社会发展学院教授,博士生导师。
*
人工智能技术迅猛发展,引发生产、生活方式变革,也改变人类理解世界的方式。同时,人工智
能技术革命的颠覆性作用引发隐私泄露、数据鸿沟、就业替代等社会问题,因人工智能技术的自主性
和算法不透明性等原因导致伦理风险剧增,为了人工智能技术的安全发展和应用,需要人工智能技
术满足人类的需求和期望,这就是人工智能价值对齐(ArtificialIntelligenceValueAlignment)。人工
智能价值对齐是一个重要的领域,因为随着人工智能系统变得越来越强大,它们可能以与人类目标
不一致的方式行事。人工智能价值对齐成为人工智能安全发展的前提和基本要义,引发了理论界和
产业界的关注。人工智能价值对齐是人工智能发展的根本性、基础性工作,是需要优先考虑的问题,
也是一项具有挑战性的工作。
一、人工智能对齐的内涵要义与价值表征
人工智能对齐对于人工智能技术的发展和应用都是根本性的。在此语境中,澄清人工智能对齐
的内涵、挖掘其技术的内在属性,分析其价值表征显得尤为重要。
1.人工智能对齐的内涵分析
人工智能对齐是一个新领域,研究如何使所创造的系统能够满足人类的需求和期望,人工智能
对齐的目标是防止人工智能的运行违背特定个人、群体或整个社会的利益。1960年,“控制论之父”
·
诺伯特维纳(NorbertWiener)在著作《自动化的道德和技术后果》中指出,随着机器学习进一步发展,
[1](1355-1358)
它们可能会超出人类预期。“我们最好完全确定赋予机器的目标就是我们真正想要的目标。”
这是人工值智能对齐的初步表达,人工智能对齐(AIalignment)就是人工智能价值对齐,维纳认为研
·
发机器的目标是最大限度地实现人的价值,是实现人类目标。布莱恩克里斯汀(BrainChristian)在
*本文系国家社会科学基金重大项目“负责任的人工智能及其实践的哲学研究”(21ZD063)的阶段性成果。
·94·
人工智能价值对齐的价值表征及伦理路径
《人机对齐:如何让人工智能学习人类价值观》中对人工智能对齐给出的定义为:“如何确保这些模型
捕捉我们的规范和价值观,理解我们的意思或意图,最重要的是,做我们想做的事,已经成为计算机
[2](11)·
科学领域最核心、最紧迫的科学问题之一。它就是:对齐问题。”2019年,弗吉尼娅迪格纳姆
[3](2)
(VirginiaDignum)提出人工智能“以人类福祉为中心,并与社会价值观和伦理原则保持一致”。
人工智能对齐指的是人工智能系统的目标与人类利益与价值观相一致,人工智能发展符合人类意
图。通过上述对人工智能对齐内涵要义的分析,我们可以看出,人工智能对齐是研究如何使人类创
造的人工智能系统能够
您可能关注的文档
- 加快建设人工智能大模型中文训练数据语料库.pdf
- 医学人工智能研究热点双聚类分析.pdf
- 图像生成式人工智能Midjourney生成的故事绘本的视觉叙事研究.pdf
- 基于CT影像的人工智能在预测非小细胞肺癌EGFR突变中的研究进展.pdf
- 基于人工智能技术的微课制作应用探讨.pdf
- 基于人工智能的列车运行图智能编制技术体系框架研究.pdf
- 基于人工智能的电力系统光纤故障检测研究(1).pdf
- 基于人工智能的镁合金压铸模标准件快速检索及自动装配系统的研究.pdf
- 基于人工智能算法的作业现场人员设备资质识别技术研究.pdf
- 基于公共性算法制度建构的新质生产力治理——以新一代生成式人工智能参与数字政府建设为例.pdf
- 2024年安徽省合肥市企业人力资源管理师之四级人力资源管理师考试完整版【精选题】.docx
- 2024年安徽省滁州市企业人力资源管理师之四级人力资源管理师考试精品题库完整.docx
- 2024年安徽省淮南市企业人力资源管理师之四级人力资源管理师考试精品题库附答案(黄金题型).docx
- 2024年安徽省六安市企业人力资源管理师之一级人力资源管理师考试完整版及答案【新】.docx
- 2024年安全生产会议讲话稿精选范文(四篇) .pdf
- 2023年乡村振兴专题培训班心得体会交流发言稿(五篇) .pdf
- 2023年《三国演义》读后感(汇编15篇)_5 .pdf
- 2023年公务员(国考)之公务员面试通关题库(附带答案) .pdf
- 2024年安徽省铜陵市企业人力资源管理师之一级人力资源管理师考试题库大全(考点提分).docx
- 2024年安徽省安庆市企业人力资源管理师之一级人力资源管理师考试题库及答案【有一套】.docx
- 乡村振兴、双碳、储能、绿色金融 + 关注
-
实名认证服务提供商
新能源知识科普(本账号发布文档均来源于互联网公开资料,仅用于技术分享交流,相关版权为原作者所有。如果侵犯了您的相关权利,请提出指正,我们将立即删除相关资料)。
文档评论(0)