测量说话人去识别系统中的软生物特征泄漏.pdfVIP

  • 0
  • 0
  • 约1.69万字
  • 约 6页
  • 2026-02-26 发布于北京
  • 举报

测量说话人去识别系统中的软生物特征泄漏.pdf

测量说话人去识别系统中的软生物特征泄漏

SeungminSeo,OlegAulov,P.JonathonPhillips

NationalInstituteofStandardsandTechnology,Gaithersburg,MD,USA

ABSTRACT监督学习的最新进展使得可以利用公开可用的分类器

从语音中准确推断出人口统计属性[8]。这从根本上改

我们使用重新识别一词来指代从匿名语音输出中恢复

变了去标识化的格局:攻击者现在可以在无需访问原

原始说话人身份的过程。说话人去识别系统旨在降低

始录音或理解系统内部结构的情况下提取敏感生物识

重新识别的风险,但大多数评估仅关注个体层面的度

别信息。

本量,并忽视了因软生物特征泄漏带来的更广泛风险。

传统指标忽略了这些风险。EER测量说话人关联

译我们引入了软生物特征泄漏评分(SBLS),这是一种

但忽视了软生物特征推理。分布度量如KL散度也可

中统一的方法,用于量化对非唯一特征如信道类型、年能误导——相同的边际分布可能与高度可预测的软生

1龄范围、方言、说话人性别或讲话风格等零样本推理

v攻击的抵抗力。SBLS整合了三个要素:使用预训练分物特征属性共存,而分布的变化可能会保留可利用的

9系统性模式。因此,当前的评估留下了重要的问题未

6类器进行直接属性推断,通过互信息分析进行链接检

4测,以及跨相交属性的子群稳健性。应用公开可用的回答:攻击者是否仍能从匿名语音中推断出软生物特

4

征?这些系统是否会产生可以被利用的系统性伪影?

1分类器实施SBLS,我们展示了所有五个评估的去识

9.别系统都存在显著漏洞。我们的结果显示,仅使用预我们引入了软生物特征泄露分数(SBLS),一种

0通过零样本攻击场景测量暴露的统一方法。SBLS集

5训练模型且无需访问原始语音或系统细节的对手仍然

2能够可靠地从匿名输出中恢复软生物特征信息,暴露成了三个组成部分:(i)零样本属性推理量化直接软生

:

v了标准分布度量未能捕捉的基本弱点。物特征预测,(ii)系统性链接检测通过互信息捕捉可

i

x利用变换模式,以及(iii)子群稳健性识别属性交集中

rIndexTerms—说话人去识别,软生物特征,重

a不同的暴露情况。对五个SDID系统的评估揭示了标

新识别,说话人生物特征泄露准指标未能捕获的可测量泄漏,证明了在SDID研究

中需要更全面的评估方法。

1.介绍

2.软生物特征泄露分数

除了语言内容,语音信号还编码说话人的特征,

如身份、年龄范围、性别和方言[1]。说话人去识别我们定义一个SBLS为三个可解释组件的组合:

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档