儿童病理语音结构化采样规范.docxVIP

下载本文档

6
0
约6.12千字
约 15页
2025-02-17 发布于上海
举报
版权申诉

儿童病理语音结构化采样规范.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

儿童病理语音结构化采样规范

1范围

本文件规定了儿童病理语音结构化采样的术语和定义、采样方式、采样过程及采样目标等要求。本文件适用于2～6岁儿童病理语音结构化采样。

2规范性引用文件

本文件没有规范性引用文件。

3术语和定义

下列术语和定义适用于本文件。3.1

病理语音采样pathologicalspeechsampling

通过数码音频系统将病变语音声波波形转换成一连串的二进制数据，从而记录下原始模拟声波在某一时刻的状态。

3.2

采样点samplepoints

采集2～6岁儿童病理语音的隔音室。3.3

采样设备samplingequipment

基于语音采样标准化数据库，对采样的病理语音进行储存的设备。3.4

采样分析技术samplinganalysistechnology

病理语音结构化采样标准涉及一种病理语音采样方法，特别是一种基于MFCC特征提取的可以用于人工智能运算的标准化采样方法。

3.5

采样类型辨别sampletypediscrimination

在病理语音采样类别中，智能辨别儿童病理语音种类的操作。

4采样方式

4.1人工病理语音采样

在采样点，受试者使用普通话或粤语按照附录A《中国构音障碍语音评估系统词表》（简称词表）的顺序读取82个汉语的语音，检查者通过采样设备进行病理语音采样。

4.2智能病理语音采样

通过采样分析技术筛选出评估各型儿童病理语音的权重声学特征参数，基于权重声学特征通过构建ANN实现2～6岁儿童病理语音的采样类型辨别。

5采样过程

5.1采样点环境选择

最佳采样点环境是在具有隔音门、吸音岩绵的隔音室内进行，隔音度不小于40dB。

5.2采样设备的基础参数要求

采样设备需要具备44.1kHz的采样率和16bit的音质。

5.3病理语音采样数据采集

5.3.1按照词表中的82个汉语词汇，对受试者进行录音，采集82个汉语音节的病理语音样本。

5.3.2受试者应端坐，口唇距采样设备约10cm，语速自然平稳、音量适中，将词表重复录2次，如遇不认识的字检查者应予以告知。

5.4采样处理

5.4.1用语音剪辑软件（CoolEditPro2.1）将受试者第一次录音的82个目标音档剪切出来。

5.4.2分类归档，其中单元音28个，复合元音23个，辅音21个，序列语音10个。

5.4.3如果第一次录音出现噪音、干扰、波形超过窗口值、波形提示能量不足等情况，则选用第二次录音数据进行处理。如果再次出现噪音、干扰、波形超过窗口值、波形提示能量不足等情况需重新采样。

5.5采样分析

5.5.1概述

通过预加重、分帧、加窗、快速傅里叶变换、三角带通滤波器、滤波代入、扩展分帧等处理过程，提取每个音节的每一个数字语音信号的MFCC特征，形成MFCC语音库。

5.5.2预加重

5.5.2.1预加重的作用：

a）使信号的频谱变得平坦，保持在低频到高频的整个频带中，能用同样的信噪比来获得频谱；

b）消除发音过程中声带和嘴唇的相互效应，从而补偿语音。

5.5.2.2将采样点采集的病理语音采样信号通过高通滤波器进行高通预加重处理，其处理公式（1）如下：

.....................（1）

式中：

H(Z)——高通预加重值；

μ——信噪比，μ的值为0.97（可选0.9～1.0）；z——频谱。

5.5.3分帧

5.5.3.1规定时间以25ms为一分帧。

5.5.3.2为了避免相邻两帧的变化过大，两相邻帧之间重叠区域应设置为10ms。

5.5.3.3每一个语音样本取第13分帧和第19分帧，若语音样本时长不足，补零。

5.5.4加窗

分帧后将每一帧乘以汉明窗（HammingWindow），以增加帧左端和右端的连续性。假设分帧后的信号为S(n),其中n=0,1,...N-1；N=13和N=19,即帧的大小，那么乘上汉明窗后的信号值为x(n),其公式（2）如下：

x(n)=s(n)xw(n)......................（2）

式中：

x(n)——加窗信号值；

S(n)——分帧后信号值；W(n)——汉明窗。

汉明窗提取公式（3）如下：

...................（3）

式中：

W(n,a)——汉明窗提取值；

n——分帧后帧的大小；

a——

您可能关注的文档

文档评论（0）

法律咨询 + 关注: 实名认证

服务提供商

法律职业资格证、中级金融资格证持证人

法律咨询服务，专业法律知识解答和服务。

咨询作者（32人已咨询）已休息

用户编号：8027066055000030

领域认证该用户于2023年04月14日上传了法律职业资格证、中级金融资格证

1亿VIP精品文档

更多 >

儿童病理语音结构化采样规范.docxVIP