- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
中国公共安全
法庭科学
2023年第3期总第65期
ChinaPublicSecurity
LawcourtScience
2023No.3Sum.No.65
?78?
浅谈AI变声语音技术对声纹鉴定工作的影响
田贵琛张雄宋雨倩
(中华人民共和国深圳海关缉私局,深圳518000)
【摘要】文章以AI变声语音技术对声纹鉴定工作的影响为研究目的,涵盖AI语音变声技术的基本原理,分析其在声纹鉴定中呈现的特征,进行前瞻性思考并提出具体的解决措施。
【关键词】AI;变声语音;走私案件;声纹鉴定;检材
【中图分类号】G312【文献标识码】A【DOI】10.3969/j.issn.1672-2396.2023.03.017【文章编号2023]65-0078-03
DiscussionontheImpactofAIVariableVoiceTechnologyonVoiceprintIdentificationWork
TIANGuichenZHANGXiongSONGYuqian
(ForensicCenterofAnti-SmugglingBureauofShenzhenCustoms,Shenzhen518000,China)
Abstract:ThearticleaimstostudytheimpactofAIvoicechangetechnologyonvoiceprintidentification,coveringthebasicprinciplesofAIvoicechangetechnology,analyzingitscharacteristicsinvoiceprintidentification,conductingforward-lookingthinking,andproposingspecificsolutions.
Keywords:AI;voicechangespeech;smugglingcases;voiceprintidentification;testmaterial
0引言
现代声纹鉴定技术是随着声谱仪(动态声波分析仪)的发明而发展起来的,仪器通过对语音信号的频率、强度和时间三种参数的实时分析,产生一个连续可视的语音频谱,在法庭科学领域则比照指纹而形象地称这样的频谱图为声纹。基于以上,在检验鉴定分析实践中经常使用共振峰、基频、强度等反映到谱图上的参数对语音文件进行比对,以达到说话人鉴定的目的。但是
近年来,随着人工智能AI变声语音技术的飞跃发展,以及其相关软件的商业化应用,已经能够通过“套用”他人音色模版合成输出说话人的声音,达到以假乱真的程度,这给声纹鉴定工作在图谱分析上造成了前所未有的挑战[1-2]。
1通过手机“搜狗”输入法实现变声的功能
在手机中安装“搜狗”输入法并设置为默认输入
收稿日期:2023-09-15
作者简介:田贵琛(1977-),男,辽宁昌图人,中国刑事警察学院文件检验专业毕业,警务技术三级主任。张雄(1994-),男,山西吕梁人,中国刑事警察学院公安视听技术专业毕业,警务技术三级主管。宋雨倩(1993-),女,四川乐山人,西南政法大学侦查学(物证技术方向)专业毕业,三级警长。
2023年第3期总第65期
法庭科学
中国公共安全
2023No.3Sum.No.65
LawcourtScience
ChinaPublicSecurity
?79?
法,打开微信语音对话窗口,在依次进行五个操作步骤(如图1箭头标准所示)后就可以实现语音的变声功能。一是点击中间的麦克风图标。二是选择变声功能。三是选择变声模板。四是点击录音图标进行语音输入。五是通过微信转为输出语音。
2AI变声的基本逻辑
AI语音技术是AI的一个分支,AI的这种音色迁移技术可称为变声技术,可以将任何人的声音转换成特定人的声音。AI变声功能,是人工智能基于在语音表征学习、迁移学习技术上成果的转化,其基本流程为:用户通过语音输入聊天内容,所用软件的语音编码器自动将内容分为两部分,一部分为聊天内容资料,AI对聊天内容资料进行声纹特征编码,以提取用户的音色;另外一部分为韵律资料,也就是用户说话的节奏、流露的情感、包含的语气,AI通过对音频特征的压缩编码及特征抽取,学习用户的说话风格。与此同时,用户选择一个角色暨变音模板,AI自动激活说话人编码器,调出模板说话人的音色并进行替换,之后AI通过算法进行加权特征编码,并利用神经
您可能关注的文档
最近下载
- 领导班子2025年民主生活会对照检查材料例文(四个带头).docx VIP
- WD西部数据My Passport Ultra and My Passport Ultra for Mac Quick Install Guide移动硬盘安装指南English (US).pdf
- 工业园区污水BOT项目运营维护方案.doc
- 牛血清去蛋白注射液的美容作用研究.pptx
- 广数DAP03说明书.pdf VIP
- 《中国古代书法》课件——隶书.pptx VIP
- 《行书书法教程》课件.ppt VIP
- 小学数学二年级上册数学《东南西北》教学设计优秀教案.docx
- 笔奇意纵 气逸神飞--草书书写指导.ppt VIP
- 人力 -北极星总裁特助行动计划实施方案.pptx
文档评论(0)