浅谈AI变声语音技术对声纹鉴定工作的影响.docx

下载文档

0
0
约3.92千字
约 6页
2025-01-11 发布于山西
举报
版权申诉
保障服务

浅谈AI变声语音技术对声纹鉴定工作的影响.docx

1、本文档共6页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

中国公共安全

法庭科学

2023年第3期总第65期

ChinaPublicSecurity

LawcourtScience

2023No.3Sum.No.65

?78?

浅谈AI变声语音技术对声纹鉴定工作的影响

田贵琛张雄宋雨倩

（中华人民共和国深圳海关缉私局，深圳518000）

【摘要】文章以AI变声语音技术对声纹鉴定工作的影响为研究目的，涵盖AI语音变声技术的基本原理，分析其在声纹鉴定中呈现的特征，进行前瞻性思考并提出具体的解决措施。

【关键词】AI；变声语音；走私案件；声纹鉴定；检材

【中图分类号】G312【文献标识码】A【DOI】10.3969/j.issn.1672-2396.2023.03.017【文章编号2023]65-0078-03

DiscussionontheImpactofAIVariableVoiceTechnologyonVoiceprintIdentificationWork

TIANGuichenZHANGXiongSONGYuqian

(ForensicCenterofAnti-SmugglingBureauofShenzhenCustoms,Shenzhen518000,China)

Abstract:ThearticleaimstostudytheimpactofAIvoicechangetechnologyonvoiceprintidentification,coveringthebasicprinciplesofAIvoicechangetechnology,analyzingitscharacteristicsinvoiceprintidentification,conductingforward-lookingthinking,andproposingspecificsolutions.

Keywords:AI;voicechangespeech;smugglingcases;voiceprintidentification;testmaterial

0引言

现代声纹鉴定技术是随着声谱仪（动态声波分析仪）的发明而发展起来的，仪器通过对语音信号的频率、强度和时间三种参数的实时分析，产生一个连续可视的语音频谱，在法庭科学领域则比照指纹而形象地称这样的频谱图为声纹。基于以上，在检验鉴定分析实践中经常使用共振峰、基频、强度等反映到谱图上的参数对语音文件进行比对，以达到说话人鉴定的目的。但是

近年来，随着人工智能AI变声语音技术的飞跃发展，以及其相关软件的商业化应用，已经能够通过“套用”他人音色模版合成输出说话人的声音，达到以假乱真的程度，这给声纹鉴定工作在图谱分析上造成了前所未有的挑战[1-2]。

1通过手机“搜狗”输入法实现变声的功能

在手机中安装“搜狗”输入法并设置为默认输入

收稿日期：2023-09-15

作者简介：田贵琛（1977-），男，辽宁昌图人，中国刑事警察学院文件检验专业毕业，警务技术三级主任。张雄（1994-），男，山西吕梁人，中国刑事警察学院公安视听技术专业毕业，警务技术三级主管。宋雨倩（1993-），女，四川乐山人，西南政法大学侦查学（物证技术方向）专业毕业，三级警长。

2023年第3期总第65期

法庭科学

中国公共安全

2023No.3Sum.No.65

LawcourtScience

ChinaPublicSecurity

?79?

法，打开微信语音对话窗口，在依次进行五个操作步骤（如图1箭头标准所示）后就可以实现语音的变声功能。一是点击中间的麦克风图标。二是选择变声功能。三是选择变声模板。四是点击录音图标进行语音输入。五是通过微信转为输出语音。

2AI变声的基本逻辑

AI语音技术是AI的一个分支，AI的这种音色迁移技术可称为变声技术，可以将任何人的声音转换成特定人的声音。AI变声功能，是人工智能基于在语音表征学习、迁移学习技术上成果的转化，其基本流程为：用户通过语音输入聊天内容，所用软件的语音编码器自动将内容分为两部分，一部分为聊天内容资料，AI对聊天内容资料进行声纹特征编码，以提取用户的音色；另外一部分为韵律资料，也就是用户说话的节奏、流露的情感、包含的语气，AI通过对音频特征的压缩编码及特征抽取，学习用户的说话风格。与此同时，用户选择一个角色暨变音模板，AI自动激活说话人编码器，调出模板说话人的音色并进行替换，之后AI通过算法进行加权特征编码，并利用神经