智能音箱语音测试集构建示例.pdfVIP

  1. 1、本文档共3页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
XX/TXXXXX—XXXX AA 附 录 A (资料性) 语音测试集构建示例 A.1输入要求 智能音箱在语音交互过程中的输入应满足以下要求: a) 应支持中文普通话输入,宜支持英语; b) 可处理语音输入为(180 ~300)字/分的语速,单次语音输入时长不应超过30 s,特殊情 况下不应超过60 s; c) 发音单元的持续时间应不小于0.2 s,发音单元间的间隔不超过2 s;若停顿时间超过2 s, 则认为一次语音输入结束。 A.2 测试集构建方法 从噪声、回声、人声,空间、待测设备这几个维度组合构建语音唤醒测试集和语音误唤醒测试集, 尽量覆盖各种声学场景,模拟用户真实使用环境。 语音唤醒测试集通过专业录音传声器在安静环境下组织录制人员录制待测设备的唤醒词。参与录制 的人员,需考虑性别、口音、年龄等维度。 误唤醒测试集的构成,主要考虑实际应用场景中引起待测设备误唤醒的噪声来源。例如,家居环境 下音箱的误唤醒主要来源于电视、人声谈话等,所以此时选择的误唤醒语料,每24小时包含6小时电视 节目,6小时新闻节目,6小时人声对话(可选择谈话节目模拟),6小时音乐播放。 表A.1 测试集构建方法示例 维度 类别 具体类别 平稳噪声(家居环境噪声等) 非平稳噪声(电视噪声等) 噪声来源 交通工具 自然声音 其他 点声源干扰 噪声类型 散射噪声 噪声 0.3m 1m 到待测设备距离 3m 5m 与待测设备角度 0°、45°、90°、180°、其他 原始 信噪比 (-5~15)dB,步长5dB 内容类型 音乐、有声节目、听声音Skill、TTS等 回声 信回比 原始 12 XX/TXXXXX—XXXX 表A.1 测试集构建方法示例(续) (-35~0)dB,步长5dB 马路 空间类型 家居 办公 待测空间 T60 =(300±30)ms 待测空间混响(500Hz) T60 =(500±30)ms

文档评论(0)

雄霸天下 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档