- 1
- 0
- 约1.5万字
- 约 8页
- 2026-02-27 发布于北京
- 举报
设计用于聊天机器人的心理测量偏见指标:在种族偏
见测量中的应用
M.Benosman
AmazonRobotics
m_benosman@
Abstract
本人工智能(AI),特别是以大型语言模型(LLMs)或聊天机器人的形式,已经
译越来越融入我们的日常生活。在过去五年中,引入了几种LLMs,包括OpenAI
中的ChatGPT、Anthropic的Claude和Meta的Llama等。这些模型有可能应
用于广泛的人机交互应用程序,如信息检索的聊天机器人、协助公司招聘决
1策、大学录取、金融贷款审批、假释决定,甚至在医学领域通过聊天机器人
v
4进行心理治疗等。关键问题是这些聊天机器人是否会以无偏见的方式与人
2类互动,还是会进一步强化人与人之间已存在的病态偏见。如果是后者,那
3
3么如何严格测量这些偏见?我们旨在通过提出一个设计心理学度量的原则
1框架来评估聊天机器人的偏见,从而解决这一挑战。
.
9
0
51介绍
2
:
v
i人类的认知常常受到偏见的影响,这可能导致对他人产生有偏见的行为,例如Branscombe
x
randBaron[2017]。这些偏见的一些例子包括认知偏差,它们源自大脑用于高效处理信息的心
a理模式或启发式方法。虽然这些捷径通常能节省时间,但它们也可能导致错误的判断。示例
包括BerthetanddeGardelle[2023]:确认偏差,即个人倾向于支持与其信念一致的信息,以及
锚定偏差,即初始信息对决策的影响过大。易得性偏差是另一种常见的类型,其中生动或最
近的例子影响了概率的认知。从社会心理学的角度来看,人类偏见也可以被分类Branscombe
andBaron[2017],它们根植于群体动态和人际关系中。内群偏差涉及偏好自己的群体,往往
导致优待自己人。相反,外群偏差可能导致对被视为不同的人进行刻板印象或歧视。这些偏
见在种族偏见或性别刻板印象等现象中显而易见,在工作场所、教育和医疗保健等各种背景
下可能延续不平等。
在人类中,这些偏见可以通过多种心理测量测试进行衡量。现代心理测量学,即心理测量的
科学,起源于19世纪末和20世纪初,源自更广泛的心理学和统计学领域Rustetal.[2021]。
其应用范围广泛,涵盖临床心理学、教育、组织行为和社会研究。在教育中,心理测量测试
评估学生的潜能和学习成果,而在临床环境中,它们用于诊断心理健康状况。心理测量学还
在揭示偏见方面发挥了关键作用,例如通过隐性联想测验(IAT)Greenwaldetal.[1998]来衡
量隐性偏见;通过认知反映测试(CRT)Toplaketal.[2011]评估个体在多大程度上依赖直觉
ThisworkhasbeendoneoutsideofAmazon.
39thConferenceonNeuralInformationProcessingSystems(NeurIPS2025)Workshop.
而非深思熟虑的推理;通过现代
您可能关注的文档
- 梦想 : 域感知推理用于高效的自主水下监测.pdf
- 高斯对齐通过单视图重建估计相对相机姿态.pdf
- GitHub 的 Copilot 代码审查:人工智能能否在你提交之前发现安全漏洞?.pdf
- 气压计辅助姿态估计.pdf
- 用于森林砍伐检测的联邦学习:一种基于卫星图像的分布式方法.pdf
- 无监督 ALS EPICS 事件日志中的异常检测.pdf
- 从 3D 定位到图像处理的 CLAP 泛化,与 RANSAC 及 Hough 变换的关联.pdf
- 现代化 Facebook 限定搜索:关键词与嵌入式混合检索结合大语言模型评估.pdf
- 立臂协调操作用于幕墙安装.pdf
- 使用视觉语言模型控制仿生手:评估物体感知和抓握推断.pdf
原创力文档

文档评论(0)