2025年线性代数公平机器学习中的统计 parity 试题.docVIP

下载本文档

1
0
约6.45千字
约 9页
2026-05-27 发布于江苏
举报

2025年线性代数公平机器学习中的统计 parity 试题.doc

2025年线性代数公平机器学习中的统计parity试题

一、统计parity的数学定义与线性代数表示

统计parity作为群体公平性的核心度量指标，其数学定义可表述为：对于受保护属性(A)（如性别、种族等二元变量，(A\in{0,1})）和模型预测结果(\hat{Y})（正例表示有利决策，(\hat{Y}\in{0,1})），需满足(P(\hat{Y}=1|A=0)=P(\hat{Y}=1|A=1))。该等式要求不同受保护群体获得有利决策的概率相等，从线性代数视角可通过以下框架展开：

1.1向量空间表示

设数据集包含(n)个样本，每个样本的特征向量为(\boldsymbol{x}i\in\mathbb{R}^d)，受保护属性向量为(\boldsymbol{A}=[A_1,A_2,...,A_n]^T\in{0,1}^n)，模型参数向量为(\boldsymbol{w}\in\mathbb{R}^d)，则线性分类器的预测函数为：

[

\hat{Y}(\boldsymbol{x})=\text{sign}(\boldsymbol{w}^T\boldsymbol{x}+b)

]

其中(b\in\mathbb{R})为偏置项。统计parity要求模型对两组样本的预测正例率相等，即：

[

\frac{1}

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

2025年线性代数公平机器学习中的统计 parity 试题.docVIP