《智能语音交互质量评价规范》.pdfVIP

  • 15
  • 0
  • 约2.67万字
  • 约 23页
  • 2023-10-18 发布于浙江
  • 举报
ICS 35.240.01 CCS 77 团 体 标 准 T/CESAXXXX—202X 智能语音交互质量评价规范 Specification for quality evaluation ofintelligentvoiceinteraction 征求意见稿 在提交反馈意见时,请将您知道的相关专利连同支持性文件一并附上。 已授权的专利证明材料为专利证书复印件或扉页,已公开但尚未授权的专利申请 证明材料为专利公开通知书复印件或扉页,未公开的专利申请的证明材料为专利申请 号和申请日期。 202X-XX- XX发布 202X-XX- XX 实施 中国电子工业标准化技术协会 发 布 T/CESA XXXX—202X 智能语音交互质量评价规范 1 范围 本文件规定了智能语音交互服务在唤醒、语音识别、全双工、意图满足、语音合成等方面的分级和 要求,描述了对应的测试方法。 本文件适用于指导智能语音交互系统的开发与测试,对智能语音交互服务的整体质量或部分技术指 标进行评价。 2 规范性引用文件 下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件, 仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本 (包括所有的修改单)适用于本 文件。 GB/T 36464 信息技术 智能语音交互系统 GB/T 21024—2007 中文语音合成系统通用技术规范 GB/T 41813.1-2022 信息技术 智能语音交互测试方法 第1部分:语音识别 3 术语和定义 GB/T 36464、GB/T 21024界定的以及下列术语和定义适用于本文件。 3.1 唤醒 awaken 触发智能语音交互用户界面的语音控制操作。 3.2 唤醒词 awaken word 用于唤醒智能语音交互的关键词。 3.3 免唤醒语音交互 wake free voice interaction 在语音交互系统待机状态下,当用户给出相关指令时,系统无需唤醒就可以正确的执行指令。 3.4 语音识别 speech recognition 4 T/CESA XXXX—202X 将人类的声音信号转化为文字或者指令的过程。 [来源:GB/T 36464.1—2020,3.7] 3.5 全双工 fullduplex 能够同时双向传递数据的通信方法。 3.6 意图 intent 用户期望通过智能语音交互达到某种目的的想法。 3.7 意图满足 intent fulfillment 实现或达到意图目标的程度。 3.8 语音合成 speech synthesis 通过机械的、电子的方法合成人类语言的过程。 [来源:GB/T 21024—2007,3.1] 4 语音交互系统框架 语音交互系统分为全双工模块、唤醒模块、语音识别模块和意图满足模块,语音交互系统中的各模 块可选择在本地、云端或融合实现。其中: a) 全双工模块包括声音前处理模块和语音输出 (语音合成)模块。其中: 1)声音前处理模块负责将语音输入转化为语音流,作为全双工模块的输入; 2)语音输出 (语音合成)模块提供计算机可识别的文本信息转换为语音流输出。 b) 唤醒模块负责系统在空闲状态时接受唤醒词输入,并触发智能语音交互系统的语音控制操作; c) 语音识别模块负责将语音流转换为人类可识别的文本信息并直接输出到相关的应用模块,或 转换为计算机可识别的文本信息并输出到语义理解模块; d) 意图满足模块负责对语音识别模块提供的文本信息做语义解析,并

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档