XH-202615_复杂交互场景的抗干扰语音指令识别技术.pdfVIP

  • 25
  • 0
  • 约6.61千字
  • 约 11页
  • 2026-04-28 发布于江苏
  • 举报

XH-202615_复杂交互场景的抗干扰语音指令识别技术.pdf

题目编号:XH-202615

复杂交互场景的抗干扰语音指令识别技术

比赛方案

一、发榜单位

美的集团(上海)有限公司

二、题目名称

复杂交互场景的抗干扰语音指令识别技术

三、题目介绍

随着智能语音设备的普及和人工智能技术的快速发展,人

机交互已经遍及智能家居、车载系统、公共服务等多样化领域,

其中基于语音的交互方式为用户提供了更自然便捷的交互体验,

推动了智能化应用场景的拓展与深化。然而,在复杂开放场景

中,由于多种噪声干扰、多说话人语音重叠等问题,语音识别

系统的准确性和鲁棒性往往严重下降。尤其在唤醒词识别与指

令理解环节,如何准确识别目标说话人的指令,同时有效拒识

非目标说话人,成为提升语音交互系统可靠性和实用性的关键

挑战。

因此,本次比赛聚焦语音识别的抗干扰能力提升和性能优

化,要求选手设计一套鲁棒的语音指令识别系统,针对唤醒音

频的目标发音人提升语音识别率,同时拒识非唤醒发音人,并

通过算法和模型结构优化,兼顾识别性能和模型推理效率。具

体任务包括:

1

1.搭建面向目标发音人的语音识

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档