- 1
- 0
- 约3.1万字
- 约 9页
- 2025-10-16 发布于北京
- 举报
TurboBias:通用ASR上下文偏置由GPU加
速的短语增强树支持的
AndreiAndrusenkoVladimirBataevLilitGrigoryanVitalyLavrukhinBorisGinsburg
NVIDIANVIDIANVIDIANVIDIANVIDIA
Yerevan,ArmeniaYerevan,ArmeniaYerevan,ArmeniaSantaClara,USASantaClara,USA
aandrusenko@vbataev@lgrigoryan@vlavrukhin@
摘要—识别特定的关键短语是上下文自动语音识别(ASR)上下文偏置方法可以提高关键词识别的准确性,但
中的一个基本任务。然而,大多数现有的上下文偏向方法都存在这一过程会增加额外的限制。例如,深度融合方法意味
本需要额外模型训练、显著减慢解码过程或限制ASR系统类型选着将上下文信息引入ASR模型。这个过程需要重新训
择的局限性。本文提出了一种支持所有主要类型的通用ASR上
译练ASR模型(交叉注意力方法)[5],[6]或训练一个额
下文偏向框架:CTC、转导器和注意编码器-解码器模型。该框
中架基于一个GPU加速的词提升树,使其能够在浅层融合模式下外的上下文模块[7]–[9]。SpeechLM模型也支持以额外
1用于贪婪搜索和束搜索解码,即使有大量关键短语(多达20K提示的形式引入上下文信息[10],[11],但这同样要求在
v
4项)也不会出现显著的速度下降。获得的结果表明所提出方法具模型训练过程中使用上下文学习。
1有高效率,在准确性和解码速度上超过了考虑的开源上下文偏向浅层融合方法允许避免额外的模型训练[12],[13].
0方法。我们的上下文偏向框架作为NeMo工具包的一部分公开
7在这种情况下,在解码阶段应用了上下文偏置,增加了
0提供。
.从集成到辅助增强树或图中的上下文列表中识别关键
8IndexTerms—自动语音识别,上下文偏置,短语提升,贪
0婪解码短语的概率。在[14]中表明,浅层融合在关键词识别
5的准确性上仅略逊于深层融合,同时保持了使用的灵
2
:活性。
vI.介绍
i
x浅层融合方法的缺点是解码过程显著变慢,必须以
r
a现代端到端自动语音识别(ASR)系统,如连接时束搜索模式进行以扩展假设搜索空间。这个问题在解码
序分类(CTC)[1],循环神经转导器(RNN-T)[2],和RNN-T和AED模型时尤为突出,因为在束搜索过程中
注意力编码解码器(AED)[3],在常见数据领域中已经调用解码器模块的次数相比于贪婪模式有显著增加。解
实现了相对较高的语音识别准确性[4]。然而,这些模决这一问题对于RNN-T尤为重要,因为该模型通常作
型通常在识别训练数据集中罕见或缺失的特定单词/短为准确率性能、内部语言模型(LM)能力和流式支持
语(如联系人名称、产品标题、技术术语等)时存在问之间的权衡选择[15],[16]。
题。上下文偏差方法被用来解决这个问题。为了加快上下文偏置过程,可以使用基于CTC的
上下文偏置方法的关键点是使用特定目标领域的词定位器[17],结合来自CTC或RNN-T模型的贪婪
额外数据。这可以是一个由句子组成的文本语料库,或解码结果与检测到的关键字。然而,这种方法需要一个
您可能关注的文档
- GAN 和扩散模型生成 X 光图像的感知评估.pdf
- 分布稳健控制约束于线性一维投影.pdf
- 物理设计探索用于埃米时代的线友好型领域专用处理器.pdf
- 基于阻抗的 RIS 建模的实际评估:实用见解与应用.pdf
- ScamDetect:面向一个稳健、无关紧要的框架以揭露智能合约中的威胁.pdf
- SEF-MK:通过多 k 均值量化实现无说话人嵌入的声音匿名化.pdf
- 利用混合 Transformer-自编码器框架改进实时概念漂移检测.pdf
- 增强饮食问题多目标进化优化中的决策空间多样性.pdf
- 外科知识重写在紧凑型大语言模型中:一种带有 ((IA)3) 的 “先忘后学”策略,用于局部事实调节和灾难性遗忘缓解.pdf
- 平衡隐私与效率:通过加法同态加密实现音乐信息检索.pdf
- 第十二章 数据的收集、整理与描述 单元测试(提升卷)-2024人教版七年级数学下册(原卷版).pdf
- 第十二章 数据的收集、整理与描述 单元测试(提升卷)-2024人教版七年级数学下册 (解析版).pdf
- 人教版七年级生物下册默写小纸条-默写版.pdf
- Unit 2 Stay Healthy Section A 知识清单-2025-2026学年人教版八年级英语下册.pdf
- 《瞥见,爸爸的额头纹》《沿着英雄的足迹》《为失败的她点赞》《幸福中的思考》-2022年中考语文考场作文必背范文100篇.pdf
- Unit2 Stay Healthy单元测试卷-2025-2026学年人教版英语八年级下册.pdf
- Unit2 Stay Healthy单元练习题-2025-2026学年人教版八年级英语下册.pdf
- 读后续写四种必须知道的情绪描写(解析版).pdf
- 2025-2026学年统编版八年级历史上册知识点复习.pdf
- 2026中考历史复习:第8期 易错易混梳理.pdf
最近下载
- 聚氨酯介绍课件.ppt VIP
- TCPUMT-智慧营区 安全要求.pdf VIP
- TCPUMT-智慧营区 运维管理要求.pdf VIP
- 施工现场临时用电监理实施细则.doc VIP
- (高清版)-B-T 30146-2023 安全与韧性 业务连续性管理体系 要求.pdf VIP
- (正式版)C-J-T 120-2016 给水涂塑复合钢管.docx VIP
- (部编版)语文四年级上册寒假课外阅读“天天练”30篇,附参考答案.doc
- 成都七中2026届高三一诊模拟考试数学试卷(含答案).pdf
- 1_会生活APP产品操作手册_V2.4(2022年-2023年).pdf VIP
- 国家电网公司电力安全工作规程配电部分题库(含答案).docx VIP
原创力文档

文档评论(0)