- 1
- 0
- 约1.36万字
- 约 7页
- 2026-02-26 发布于北京
- 举报
缓解声纹识别
中的说话人内部变化通过风格可控的语音增强
金美瑞朴秀真魏京垠
申贤京孙库克·穆恩张树华埃里克·维瑟
DepartmentofElectricalandElectronicEngineering,YonseiUniversity,Seoul,SouthKorea
QualcommTechnologies,Inc.,SanDiego,California,USA
ABSTRACT
本
译演讲者分割系统经常难以应对高内在的说话人内部变
异性,如情绪、健康或内容的变化。这可能导致同一说
中话人的片段被错误分类为不同的个体,例如,在对话
1中提高音量或讲话速度时。为了
您可能关注的文档
- 关于代理编码表现的使用: 克劳德代码的经验研究.pdf
- 端到端说话人分割的极限挑战.pdf
- 基于转码器的电路分析以实现可解释的单细胞基础模型.pdf
- 减轻位置不确定性对基于无线电图的预测速率选择的影响通过噪声输入高斯过程.pdf
- Wohlart 的三环机构: 过约束和不稳定的连杆结构.pdf
- RATIONANOMALY: 基于链式思维和强化学习的合理性异常检测.pdf
- 系牢: 轻量级蒸馏阿拉伯语语音基础模型.pdf
- RealMirror:一个全面的开源视觉语言动作平台用于具身 AI.pdf
- DAIEN-TTS:解耦音频插补用于环境感知的文本到语音合成.pdf
- LEED:一个多智能体强化学习中高效且可扩展的 LLM 增强专家演示框架.pdf
原创力文档

文档评论(0)