- 0
- 0
- 约2.45千字
- 约 8页
- 2026-01-27 发布于河北
- 举报
ICS35.240CCSL77
34
安徽省地方标准
DB34/T4554—2023
儿童智能语音识别技术规范
Specificationforintelligentspeechrecognitiontechnologyofchildren
2023-10-07发布2023-11-07实施
安徽省市场监督管理局发布
I
DB34/T4554—2023
前言
本文件按照GB/T1.1—2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定起草。
请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。
本文件由安徽淘云科技股份有限公司提出。
本文件由安徽省经济和信息化厅归口。
本文件起草单位:安徽淘云科技股份有限公司、科大讯飞股份有限公司、安徽工程大学计算机与信息学院、合肥巴灵瑞教育科技有限公司、合肥赑歌数据科技有限公司、安徽长三角数据感知与治理研究院、江苏理工学院、合肥师范学院、合肥智能语音创新发展有限公司。
本文件主要起草人:王晓斐、刘庆升、朱翠玲、叶娟、方明、叶剑鸣、陶皖、陈慧珺、毛四方、吕雪、胡连峰、宋若淼、高群、谢秀琴、姜志文、孙艳、张泽之、武方芳。
DB34/T4554—2023
1
儿童智能语音识别技术规范
1范围
本文件规定了儿童智能语音识别技术的术语和定义、技术路线和要求。
本文件适用于儿童智能语音识别技术的应用。
2规范性引用文件
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。
GB/T21023-2007中文语音识别系统通用技术规范
3术语和定义
下列术语和定义适用于本文件。
3.1
语音智能识别技术Speechintelligentrecognitiontechnology
通过人工智能技术识别声音,并将声音信号转化为文字或指令的过程。
3.2
声学模型Acousticmodel
输入音频经特征提取和标注后,进行深度学习获得的模型参数即为声学模型;其中,特征提取是将音频数据转换为特征向量;标注是将音频数据上的文本与其对应的特征帧对齐。
注1:声学模型的训练过程包括:数据录制、数据标注、特征提取和模型训练。
注2:声学模型训练过程中提取特征通常使用Mel频率倒谱系数(MFCC)等特征提取方法。
注3:深度学习也指模型训练,是使用已对齐数据训练声学模型,通常使用深度学习模型包括卷积神经网络(CNN)、长短时记忆网络(LSTM)等模型。
3.3
语言模型Languagemodel
利用自然语言处理技术,在词级别上对文本进行建模,输出概率最大的词序列,以解决声学模型无法解决的同音词、近义词等因素干扰的歧义性问题;其中,建模的过程是根据语言学规则、语料库语言统计等多种因素,以概率形式估计一个给定文本的出现概率,并根据这个概率来确定识别结果。
4技术路线
儿童语音智能识别的技术路线见图1。
2
DB34/T4554—2023
图1儿童语音智能识别技术路线
5要求
5.1语音信号采集
5.1.1采样率应为16KHz,采样位深应为16bit。
5.1.2音频采集应保证完整,避免截断或缺失情况的发生。
5.1.3人声和环境噪音的信噪比应不低于10dB。
5.1.4人声应是汉语通用语发声,应满足GB/T21023-2007中6.1(b)的要求。
5.1.5应支持对3~14岁年龄段人群语音信号的采集。
5.2信号处理和特征提取
5.2.1语音信号中有回声存在,应对语音信号进行回声消除处理。
5.2.2语音信号中有较大混响存在,应对语音信号进行去混响处理。
5.2.3语音信号中存在较大周围噪声,应对语音信号进行降噪处理。
5.2.4语音信号中存在特定波段频率的干扰,应对其进行滤波处理。
5.2.5在采集特定方向的语音信号时,应对语音信号进行增强处理,从而起到加强特定方向的语音信号,并抑制其他方向的语音信号。
5.2.6在进行批量语音信号处理时,应根据指定的语音信号长度(时间段或者采样数)进行分段处理。
5.2.7将语音信号从时域转换到频域,提取语音信号中的特征向量。
5.3识别
5.3.1概述
对输入的语音信号,在由语句或者单词序列构成的空间当中,按照一定的优化准则,并且根据声学模型、语言模型,生成一
您可能关注的文档
- DB11 1201-2015 印刷业挥发性有机物排放标准.docx
- DB11_T 2082-2023 公路除雪融雪作业技术规程.docx
- DB11T 494.4-2013 人力资源服务规范 第4部分:信息网络服务.docx
- DB11T 589-2010 保健按摩操作规范.docx
- DB12T 527-2014 奶牛结核病净化技术规范.docx
- DB13_T 5711-2023 长距离毫米波交通雷达应用技术要求.docx
- DB14_T 2517-2022 景区文创产品开发设计指南.docx
- DB14_T 2935-2023 临期食品管理规范.docx
- DB14∕T 1273-2016 袋栽白灵菇工厂化生产技术规程.docx
- DB14∕T 1274-2016 双孢菇保温棚工厂化生产技术规程.docx
- 中国水墨风马年年终总结汇报PPT模板.pptx
- 企管部长2025年工作总结及2026年度工作规划思路.docx
- 排污许可证管理及重污染天气政策解读培训.pptx
- 马年春节2026新年会策划年终总结汇报述职报告模板.pptx
- 2026新年红色喜迎马年节日介绍主题班会.pptx
- 单元一 汽车溯源(课件)-《汽车文化》同步教学(人民交通出版社).pptx
- 6.3汽车俱乐部(课件)-《汽车文化》同步教学(江苏凤凰教育出版社).pdf
- 6.3汽车与交通(课件)-《汽车文化》同步教学(武汉大学出版社).pdf
- 5.1汽车竞赛概述(课件)-《汽车文化》同步教学(武汉大学出版社).pdf
- 5.1汽车发展与社会--(课件)-《汽车文化》同步教学(国防科技大学出版社).pdf
原创力文档

文档评论(0)