T_AHAI 009-2024 面向文旅场景的语音交互应用服务软件规范.docxVIP

T_AHAI 009-2024 面向文旅场景的语音交互应用服务软件规范.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

ICS01.110CCSL62

AHAI

安徽省人工智能协会团体标准T/AHAI009—2024

面向文旅场景的语音交互应用服务软件规范

Specificationofvoiceinteractiveapplicationservicesoftwareforculturaltourismscenes

24-07-10发布2024-07-11实施

安徽省人工智能协会发布

II

T/AHAI009-2024

目次

前言 III

1范围 1

2规范性引用文件 1

3术语和定义 1

3.1 1

4缩略语 2

5软件框架 2

6技术要求 3

6.1输入输出 3

6.2文旅场景导览数据库 3

6.3文旅场景位置识别 3

6.4文旅场景语音识别 3

6.5文旅场景语音应答 4

6.6文旅场景语音播报 4

6.7文旅场景多轮对话 4

6.8观众咨询反馈 5

6.9维护功能 5

6.10可移植性 5

7测试方法 5

7.1环境条件 5

7.2测试准备 5

7.3输入输出 6

7.4文旅场景导览数据库 6

7.5文旅场景位置识别 6

7.6文旅场景语音识别 7

7.7文旅场景语音应答 7

7.8文旅场景语音播报 8

7.9文旅场景多轮对话 8

7.10观众咨询反馈 9

7.11维护功能 9

7.12可移植性 9

III

T/AHAI009-2024

前言

本文件按照GB/T1.1—2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定

起草。

请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。本文件由合肥工业大学等单位提出并由安徽省人工智能协会归口。

本文件起草单位:合肥工业大学、科大讯飞股份有限公司、中国科学技术大学、北京理工大学、天津恒达文博科技股份有限公司、安徽财经大学、凤阳县博物馆、浙江大学。

本文件主要起草人:唐益明、刘晓平、宋维涛、李琳、陈仁杰、李权、徐勇、郜静文、何永春、刘颖、程鸣、谢文军、曹力、李世杰、唐更生、赵洋、刘越、胡开拓、张举勇、傅孝明、杨磊、王勇超、赵磊。

1

T/AHAI009—2024

面向文旅场景的语音交互应用服务软件规范

1范围

本文件规定了应用于文旅场景时语音交互服务软件的框架、技术要求和测试方法。本文件应用于文旅场景的语音交互应用服务软件的开发和测试。

2规范性引用文件

下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅所注日期的版本适用于本文件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。

GB3096-2008声环境质量标准

GB/T21023-2007中文语音识别系统通用技术规范GB/T21024-2007中文语音合成系统通用技术规范

GB∕T36464.2-2018信息技术智能语音交互系统第2部分:智能家居GB/T36464.3-2018智能语音交互系统第3部分:智能客服

3术语和定义

下列术语和定义适用于本文件。

3.1

语音识别speechrecognition

将人类的声音信号转化为文字或者指令的过程。

[来源:GB/T21023-2007,3.1]

3.2

语音合成speechsynthesis

通过机械的、电子的方法合成人类语言的过程。

[来源:GB/T21024-2007,3.1]

3.3

多轮对话multi-rounddialogue

在人机对话中,机器和用户之间进行多次的问答交流,机器初步明确用户意图之后,获取必要信息

以最终得到明确用户指令的方式。

3.4

噪声noise

语音采集过程中,采集到的由非目标语音信号源发出的,能干扰、影响对目标语音信号的识别、理解或处理的声学信号。

[来源:GB∕T36464.2-2018,3.16]

3.5

问答对questionanswerpair

在人机对话中,机器和用户之间进行的一次完整的提问和回答。

3.6

导览数据库navigationdatabase

2

T/AHAI009—2024

引导游览的地图、导览点分布、区域结构等各种信息汇集形成的数据库。

4缩略语

下列缩略语

文档评论(0)

馒头 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:6230041031000032

1亿VIP精品文档

相关文档