- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
一种适用于移动全双工语音交互的小型声学
回波消除解决方案
stnd
1YihengJiang2BiaoTian
SpeechLab,AlibabaGroupSpeechLab,AlibabaGroup
Beijing,ChinaBeijing,China
jiangyiheng.jyh@tianbiao.tb@
摘要—在全双工语音交互系统中,有效的声学回波消除框架内,王等人[5]应用多任务学习来处理回音抑制、
(AEC)对于恢复受回波污染的语音至关重要。本文提出了一噪声减少和近端语音活动检测。
本种基于神经网络的AEC解决方案,以解决移动场景中存在的硬对于应用于全双工应用的AEC技术,特别是当音
件变化、非线性失真和长延迟等挑战。我们首先结合了多种数据
译频通过手机扬声器输出时,第三方开发者面临几个挑
增强策略来提高模型在各种环境下的鲁棒性。此外,采用渐进学
中习逐步提升AEC的效果,显著提高了语音质量。为进一步优化战。这些包括:(a)设备多样性以及由此导致的因硬件
1AEC的下游应用,我们引入了一种新颖的后处理策略,该策略特性不同而产生的非线性失真[9],(b)内置系统级AEC
v
1使用专门针对语音活动检测(VAD)和自动语音识别(ASR)算法效果不一致,和(c)参考信号与麦克风信号之间的
6等任务设计的定制参数,从而提升了它们的整体效果。最后,我延迟变化,范围从几毫秒到几百毫秒[10],这是由于硬
5们的方法采用了一个具有流式推理能力的小型模型,实现了在移
7件延迟和软件缓冲[11]导致的。
0动设备上的无缝部署。实验证明了所提出的方法在回波返回损耗
8.增强和感知语音质量评估方面的有效性,并且显著改善了VAD这些挑战突显了需要一个灵活的应用层AEC算法
0和ASR的结果。来补充或与内置的系统级AEC合作,从而提高各种移
5
2IndexTerms—声回波消除,全双工交互,数据增强,渐动设备之间的兼容性,并实现有效的全双工交互。在
:进学习,后处理。[9]中,结合统计回声抑制方法的LAEC被用于移动电
v
i
x话VoIP场景。然而,这种方法并未考虑到不同设备间
r
aI.介绍的硬件差异。此外,Heitkaemper等人在[12]中实现了
流式AEC系统以改善智能语音助手中的关键词识别和
语音交互系统的性能严重受到声学回声的影响[1],ASR性能。但是,这种方法仅限于由唤醒词发起的单一
[2]。因此,AEC是一项关键技术,通过消除这种不必交互,并未解决需要同时考虑VAD和ASR效果来优化
要的反馈提供纯净的音频通信[3]。AEC的连续全双工交互问题。
最近关于AEC的研究,无论是使用[4],[5]还是不本文中,我们提出了一种专为VAD和ASR任务设
使用[6],[7]神经网络(NN),都引起了广泛关注。对于计的新型两阶段AEC系统,旨在应用于移动全双工交
基于NN的AEC方法,一种常见的方法包括两个阶段,互场景。我们的贡献包括:(a)利用多方面的数据增强
如图1(a)所示。第一阶段采用自适应滤波器来处理假(DA)技术提高模型在各种移动声学场景中的适应性。
您可能关注的文档
- 使用时频回归和运动-顶叶网络整合改进 EEG 连续抓取力解码.pdf
- Ethics2vec: 自动代理与人类偏好的对齐.pdf
- GraphCoT-VLA:一种用于处理模糊指令的机器人操作的三维空间感知推理视觉语言动作模型.pdf
- LaRender:通过潜在渲染在图像生成中实现无训练遮挡控制.pdf
- 利用基于图的空域异常检测与纠正增强静态环境中的自我中心对象检测.pdf
- SOFA:用于模拟和优化房颤消融的深度学习框架.pdf
- 牙科锥束计算机断层扫描中带有截断视野的迭代重建方法.pdf
- HGMF:用于模型上下文协议中可扩展工具调用的分层高斯混合框架.pdf
- MSPT:一种基于多阶段渐进训练的轻量级人脸图像质量评估方法.pdf
- 从平台迁移到文化融合:#wlw 从抖音到红线在酷儿女性社群中的传播与扩散.pdf
- 实施指南(2025)《JB_T 12842-2016空调系统用辐射换热器》.pptx
- 实施指南(2025)《JB_T 12843 - 2016 离心式制冷剂压缩机解读》.pptx
- 实施指南(2025)《JB_T 12851-2016柴油机喷油泵 等压出油阀偶件》.pptx
- 实施指南(2025)《HJ 804-2016土壤 8种有效态元素的测定 二乙烯三胺五乙酸浸提-电感耦合等离子体发射光谱法》.pptx
- 实施指南(2025)《HJ600-2011水质梯恩梯、黑索今、地恩梯的测定气相色谱法》.pptx
- 实施指南(2025)《JB_T 6118 - 2016 沉降过滤离心机解析》.pptx
- 实施指南(2025)《HJ 811-2016水质 总硒的测定 3,3'-二氨基联苯胺分光光度法》.pptx
- 实施指南(2025)《HJ 814-2016水和土壤样品中钚的放射化学分析方法》.pptx
- 实施指南(2025)《HJ19-2011环境影响评价技术导则生态影响》.pptx
- 实施指南(2025)《HJ605-2011 土壤挥发性有机物检测标准解读》.pptx
- 专业Latex文档翻译 + 关注
-
实名认证服务提供商
专业Latex文档翻译,完整保持文档排版,完美处理文档中的数学公式和图表等元素,并提供 arXiv Latex 论文中文翻译。
文档评论(0)