- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
ICS17.140.99CCSL70
34
安徽省地方标准
DB34/T4739—2024
声纹检测通用规范
Generalspecificationforvoiceprintdetection
2024-04-15发布2024-05-15实施
安徽省市场监督管理局发布
.
DB34/T4739—2024
I
前言
本文件按照GB/T1.1—2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定起草。
请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。
本文件由安徽省工业和信息化厅提出并归口。
本文件起草单位:科大讯飞股份有限公司、安徽省质量和标准化研究院、合肥智能语音创新发展有限公司、合肥产品质量监督检验研究院。
本文件主要起草人:宫韬、褚繁、程鸣、李俊、蔡明琦、张迪、车骋、徐甲甲、李心、储汉卿、任颖、凌俊杰、宋若淼、李然。
DB34/T4739—2024
1
声纹检测通用规范
1范围
本文件规定了声纹检测的准备和方法要求。
本文件适用于工业产品和工业设备的声纹检测。
2规范性引用文件
本文件没有规范性引用文件。
3术语和定义
下列术语和定义适用于本文件。
3.1
声纹voiceprint
工业产品和工业设备发出声波信号中的特征信息。
3.2
声纹检测voiceprintdetection
运用电声学系统,利用人工智能等技术测试和分析工业产品和工业设备声纹的过程。
4检测准备
4.1声音采集
4.1.1总体要求
多次声音采集过程中的环境参数、采集方式、采集音频参数、采集样本时长和总量应保持一致。
4.1.2采集设备
4.1.2.1采集设备包括但不限于:拾音设备、模数转换、编码器、存储设备。
4.1.2.2采集设备性能指标应根据采集对象合理适配,编码格式宜采用PCM编码,模数转换量化精度宜大于等于16bit。
4.1.3采集方式
4.1.3.1拾音设备与被采集对象应相对固定。
4.1.3.2拾音设备宜贴近被采集对象,采集方向宜正对被采集对象发声位置。
4.1.4采集环境
4.1.4.1采集过程中应避免出现采集环境之外的其他异常噪声。
4.1.4.2采集环境噪声宜不大于30dB(A)。
4.1.5采集音频参数
DB34/T4739—2024
2
采集的音频参数应符合以下要求:
a)采样率:≥48K;
b)峰值幅度:≥-18dBFS且≤-3dBFS。
4.1.6采集样本
样本应覆盖所有正常和异常类别,单条样本时长不小于10秒,样本总量每个类别不小于500条。
4.2标注
4.2.1标注方法
4.2.1.1在计算机上对采集到的声音样本进行标注,对样本所进行的标注包括两种标注类别(正常和异常类别),每个样本应仅有一种标注类别。
4.2.1.2检测人员使用计算机上的音频播放软件对待标注样本进行辨听,再进行标注结果记录,若无法判断是否为异常可注明无法判断。
4.2.2标注格式
标注完成后形成标注记录,存储于关系型数据库中,声纹样本标注字段见表1。若待标注样本为正常声纹,则异常开始时间和异常结束时间一栏为斜杠符(/)。
表1声纹样本标注字段说明
字段名称
字段类型
字段描述
备注
VoiceId
String
音频ID
MarkTime
Long
样本时长
单位:毫秒
MarkPerson
String
标注人员编号
录入人员编号
Abnormal
String
声纹类型标签
正常/异常/无法判断
StartPoint
Double
异常开始时间
单位:毫秒
EndPoint
Double
异常结束时间
单位:毫秒
4.3建立模型
对检测人员标注为正常/异常的声音样本提取声学特征,利用机器学习算法对声学特征进行建模,得到可区分正常和异常类别的声纹分类模型,用于进行后续声纹检测任务。
5检测流程图
检测流程图见图1。
3
DB34/T4739—2024
部署拾音设备
部署拾音设备
采集现场声音
比对
检测结果输出
图1检测流程图
6方法
6.1部署拾音设备
6.1.1应符合4.1.2和4.1.3规定的要求。
6.1.2单个工业设备或工业产品对应一个拾音设备。
6.1.3拾音设备应连接模数转换器形成拾音设备系统。
6.2采集现场声音
6.2.1采集环境
在生产线环境下进行,采集环境噪声宜不大于30dB(A),可使用
您可能关注的文档
- (高清版)DBJ50∕T-511-2025 城镇排水系统评价标准.docx
- (高清版)DBJ50∕T-514-2025 装配式综合支吊架应用技术标准.docx
- (高清版)DB13(J)∕T 8554-2023 城乡智慧燃气技术标准.docx
- (高清版)DB13(J)∕T 8557-2023 建设工程消耗量标准及计算规则(房屋修缮建筑工程).docx
- (高清版)DB13(J)∕T 8560-2023 城市污水处理智能监管系统技术标准.docx
- (高清版)DB13(J)∕T 8561-2023 民用建筑渗漏修缮技术标准.docx
- (高清版)DB13(J)∕T 8567-2024 房屋建筑和市政基础设施拆除工程安全技术标准.docx
- (高清版)DB13(J)∕T 8574-2024 多层装配式混凝土多孔墙板结构技术标准.docx
- (高清版)DB13(J)∕T 8580-2024 双面彩钢板复合风管技术规程.docx
- (高清版)DB13(J)∕T 8582-2024 城市道路工程施工质量验收标准.docx
- (高清版)DB34∕T 4740-2024 高空抛物视频监控系统建设规范.docx
- (高清版)DB34∕T 4741-2024 公共安全视频图像信息系统建设期运维评价规范.docx
- (高清版)DB34∕T 4744-2024 养老机构老年人委托代办服务指南.docx
- (高清版)DB34∕T 4745-2024 养老机构应急预案演练指南.docx
- (高清版)DB34∕T 4747-2024 农村社区服务站建设指南.docx
- (高清版)DB34∕T 4748-2024 社区养老物业参与服务规范.docx
- (高清版)DB34∕T 4753-2024 人力资源服务机构 社区就近就业服务规范.docx
- (高清版)DB34∕T 4754-2024 人力资源服务产业园运营规范.docx
- (高清版)DB34∕T 4756.2-2024 矿山生态修复规程 第2部分:质量检验与评定.docx
- (高清版)DB34∕T 4756.3-2024 矿山生态修复规程 第3部分:工程验收.docx
文档评论(0)