(高清版)DB34∕T 4739-2024 声纹检测通用规范.docxVIP

(高清版)DB34∕T 4739-2024 声纹检测通用规范.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

ICS17.140.99CCSL70

34

安徽省地方标准

DB34/T4739—2024

声纹检测通用规范

Generalspecificationforvoiceprintdetection

2024-04-15发布2024-05-15实施

安徽省市场监督管理局发布

.

DB34/T4739—2024

I

前言

本文件按照GB/T1.1—2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定起草。

请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。

本文件由安徽省工业和信息化厅提出并归口。

本文件起草单位:科大讯飞股份有限公司、安徽省质量和标准化研究院、合肥智能语音创新发展有限公司、合肥产品质量监督检验研究院。

本文件主要起草人:宫韬、褚繁、程鸣、李俊、蔡明琦、张迪、车骋、徐甲甲、李心、储汉卿、任颖、凌俊杰、宋若淼、李然。

DB34/T4739—2024

1

声纹检测通用规范

1范围

本文件规定了声纹检测的准备和方法要求。

本文件适用于工业产品和工业设备的声纹检测。

2规范性引用文件

本文件没有规范性引用文件。

3术语和定义

下列术语和定义适用于本文件。

3.1

声纹voiceprint

工业产品和工业设备发出声波信号中的特征信息。

3.2

声纹检测voiceprintdetection

运用电声学系统,利用人工智能等技术测试和分析工业产品和工业设备声纹的过程。

4检测准备

4.1声音采集

4.1.1总体要求

多次声音采集过程中的环境参数、采集方式、采集音频参数、采集样本时长和总量应保持一致。

4.1.2采集设备

4.1.2.1采集设备包括但不限于:拾音设备、模数转换、编码器、存储设备。

4.1.2.2采集设备性能指标应根据采集对象合理适配,编码格式宜采用PCM编码,模数转换量化精度宜大于等于16bit。

4.1.3采集方式

4.1.3.1拾音设备与被采集对象应相对固定。

4.1.3.2拾音设备宜贴近被采集对象,采集方向宜正对被采集对象发声位置。

4.1.4采集环境

4.1.4.1采集过程中应避免出现采集环境之外的其他异常噪声。

4.1.4.2采集环境噪声宜不大于30dB(A)。

4.1.5采集音频参数

DB34/T4739—2024

2

采集的音频参数应符合以下要求:

a)采样率:≥48K;

b)峰值幅度:≥-18dBFS且≤-3dBFS。

4.1.6采集样本

样本应覆盖所有正常和异常类别,单条样本时长不小于10秒,样本总量每个类别不小于500条。

4.2标注

4.2.1标注方法

4.2.1.1在计算机上对采集到的声音样本进行标注,对样本所进行的标注包括两种标注类别(正常和异常类别),每个样本应仅有一种标注类别。

4.2.1.2检测人员使用计算机上的音频播放软件对待标注样本进行辨听,再进行标注结果记录,若无法判断是否为异常可注明无法判断。

4.2.2标注格式

标注完成后形成标注记录,存储于关系型数据库中,声纹样本标注字段见表1。若待标注样本为正常声纹,则异常开始时间和异常结束时间一栏为斜杠符(/)。

表1声纹样本标注字段说明

字段名称

字段类型

字段描述

备注

VoiceId

String

音频ID

MarkTime

Long

样本时长

单位:毫秒

MarkPerson

String

标注人员编号

录入人员编号

Abnormal

String

声纹类型标签

正常/异常/无法判断

StartPoint

Double

异常开始时间

单位:毫秒

EndPoint

Double

异常结束时间

单位:毫秒

4.3建立模型

对检测人员标注为正常/异常的声音样本提取声学特征,利用机器学习算法对声学特征进行建模,得到可区分正常和异常类别的声纹分类模型,用于进行后续声纹检测任务。

5检测流程图

检测流程图见图1。

3

DB34/T4739—2024

部署拾音设备

部署拾音设备

采集现场声音

比对

检测结果输出

图1检测流程图

6方法

6.1部署拾音设备

6.1.1应符合4.1.2和4.1.3规定的要求。

6.1.2单个工业设备或工业产品对应一个拾音设备。

6.1.3拾音设备应连接模数转换器形成拾音设备系统。

6.2采集现场声音

6.2.1采集环境

在生产线环境下进行,采集环境噪声宜不大于30dB(A),可使用

您可能关注的文档

文档评论(0)

xm + 关注
实名认证
文档贡献者

专业学习资料,专业文档

1亿VIP精品文档

相关文档