测量说话人去识别系统中的软生物特征泄漏.pdfVIP

下载本文档

0
0
约1.69万字
约 6页
2026-02-26 发布于北京
举报

测量说话人去识别系统中的软生物特征泄漏.pdf

测量说话人去识别系统中的软生物特征泄漏

SeungminSeo,OlegAulov,P.JonathonPhillips

NationalInstituteofStandardsandTechnology,Gaithersburg,MD,USA

ABSTRACT监督学习的最新进展使得可以利用公开可用的分类器

从语音中准确推断出人口统计属性[8]。这从根本上改

我们使用重新识别一词来指代从匿名语音输出中恢复

变了去标识化的格局：攻击者现在可以在无需访问原

原始说话人身份的过程。说话人去识别系统旨在降低

始录音或理解系统内部结构的情况下提取敏感生物识

重新识别的风险，但大多数评估仅关注个体层面的度

别信息。

本量，并忽视了因软生物特征泄漏带来的更广泛风险。

传统指标忽略了这些风险。EER测量说话人关联

译我们引入了软生物特征泄漏评分（SBLS），这是一种

但忽视了软生物特征推理。分布度量如KL散度也可

中统一的方法，用于量化对非唯一特征如信道类型、年能误导——相同的边际分布可能与高度可预测的软生

1龄范围、方言、说话人性别或讲话风格等零样本推理

v攻击的抵抗力。SBLS整合了三个要素：使用预训练分物特征属性共存，而分布的变化可能会保留可利用的

9系统性模式。因此，当前的评估留下了重要的问题未

6类器进行直接属性推断，通过互信息分析进行链接检

4测，以及跨相交属性的子群稳健性。应用公开可用的回答：攻击者是否仍能从匿名语音中推断出软生物特

征？这些系统是否会产生可以被利用的系统性伪影?

1分类器实施SBLS，我们展示了所有五个评估的去识

9.别系统都存在显著漏洞。我们的结果显示，仅使用预我们引入了软生物特征泄露分数（SBLS），一种

0通过零样本攻击场景测量暴露的统一方法。SBLS集

5训练模型且无需访问原始语音或系统细节的对手仍然

2能够可靠地从匿名输出中恢复软生物特征信息，暴露成了三个组成部分：(i)零样本属性推理量化直接软生

v了标准分布度量未能捕捉的基本弱点。物特征预测，(ii)系统性链接检测通过互信息捕捉可

x利用变换模式，以及(iii)子群稳健性识别属性交集中

rIndexTerms—说话人去识别，软生物特征，重

a不同的暴露情况。对五个SDID系统的评估揭示了标

新识别，说话人生物特征泄露准指标未能捕获的可测量泄漏，证明了在SDID研究

中需要更全面的评估方法。

1.介绍

2.软生物特征泄露分数

除了语言内容，语音信号还编码说话人的特征，

如身份、年龄范围、性别和方言[1]。说话人去识别我们定义一个SBLS为三个可解释组件的组合：

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

测量说话人去识别系统中的软生物特征泄漏.pdfVIP