2025年线性代数公平机器学习中的统计 parity 试题.docVIP

  • 1
  • 0
  • 约6.45千字
  • 约 9页
  • 2026-05-27 发布于江苏
  • 举报

2025年线性代数公平机器学习中的统计 parity 试题.doc

2025年线性代数公平机器学习中的统计parity试题

一、统计parity的数学定义与线性代数表示

统计parity作为群体公平性的核心度量指标,其数学定义可表述为:对于受保护属性(A)(如性别、种族等二元变量,(A\in{0,1}))和模型预测结果(\hat{Y})(正例表示有利决策,(\hat{Y}\in{0,1})),需满足(P(\hat{Y}=1|A=0)=P(\hat{Y}=1|A=1))。该等式要求不同受保护群体获得有利决策的概率相等,从线性代数视角可通过以下框架展开:

1.1向量空间表示

设数据集包含(n)个样本,每个样本的特征向量为(\boldsymbol{x}i\in\mathbb{R}^d),受保护属性向量为(\boldsymbol{A}=[A_1,A_2,...,A_n]^T\in{0,1}^n),模型参数向量为(\boldsymbol{w}\in\mathbb{R}^d),则线性分类器的预测函数为:

[

\hat{Y}(\boldsymbol{x})=\text{sign}(\boldsymbol{w}^T\boldsymbol{x}+b)

]

其中(b\in\mathbb{R})为偏置项。统计parity要求模型对两组样本的预测正例率相等,即:

[

\frac{1}

文档评论(0)

1亿VIP精品文档

相关文档