面向互联网实时音视频服务的端到端噪声抑制性能评测测试集与评估工具规范.pdfVIP

  • 0
  • 0
  • 约5.34千字
  • 约 3页
  • 2026-01-28 发布于河南
  • 举报

面向互联网实时音视频服务的端到端噪声抑制性能评测测试集与评估工具规范.pdf

SJ/TXXXXX.2—XXXX

A

附录A

(规范性)

测试集与评估工具规范

A.1测试集

测试集中的音频信号包含语音信号、音乐信号、噪声信号用例以附件的形式给出,具体的信息如表A.1。

表A.1音频信号特征

信号类型文件名称信号平均能量信号描述

±

()

语音信号Speech_lan_gender.wav−26不同语言、男女声

音乐信号Music_type.wav−12不同类型音乐

噪声信号Noise_type.wav−26不同类型噪声

校准信号Calibration.wav−26白噪声、语音信号

语音信号示例“Speech_cn_male.wav”:此信号表示中文、男声的语音信号。此信号语音段平均能

量为−26。

音乐信号示例“Music_piano.wav”:此信号表示钢琴音乐信号。此信号语音段平均能量为−12,

音乐时域占空比大于90%。

噪声信号示例“Noise_babble.wav”:此信号表示嘈杂人声噪声信号。此信号语音段平均能量为

−1295%35%

,噪声时域占空比大于(冲击噪声除外,时域占空比大于即可)。噪声信号种类包括

了:白噪声、分红噪声、嘈杂人声噪声、风噪声、马路噪声、机械噪声、键盘噪声、敲击噪声、音乐噪

声、游戏噪声等。在冲击噪声(例如键盘噪声、敲击噪声)中,除所需噪声外,底噪应保持≤−60。

校准信号包含白噪声、语音信号,平均信号能量为−26。

实际评测中,语音信号的数量应大于20,并至少覆盖男女声;噪声信号的数量应大于10,至少覆盖

平稳噪声、非平稳噪声、冲击噪声,至少覆盖[0,10,20]三种信噪比。

A.2典型场景测试集

针对不同应用的典型场景,推荐了集中常见的测试集的组合方法,从而形成针对特定应用场景的测

试集用例,以压缩文件的形式给出,见表A.2(获取地址和调用方式介绍:

/portalIndex/#/platformDetail/intro/1672904927040233474/1673224

358471655425)。

表A.2典型场景下的测试集用例

应用场景典型场景测试集名称描述

音视频会议音视频会议测试集.zip侧重于语音信号在室内噪声下的场景,也包括一些

音乐信号、室外噪声

直播连麦直播连麦测试集.zip侧重于语音/音乐信号在室内噪声下的场景,也包

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档