网站大量收购独家精品文档,联系QQ:2885784924

AI辅助编码实现录音的自动脱敏.pdf

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

AI辅助编码实现录⾳的⾃动脱敏

写在前⾯

⼤家好,我是海海,⾦融企业IT部⻔研发经理。⽬前专注于AI编程、AI智能体领域。

本章介绍

本⽂借助GPT-4o进⾏辅助编码,实现将通话录⾳中的敏感信息(例如⾝份证号、证件号、⼿

机号)等进⾏脱敏处理,以达到特定场合下的合规要求。

⼀、背景介绍

对于企业中⼀些重要的⾳视频⽂件,有时候需要提供给第三⽅进⾏调阅调听使⽤,但是⼜担⼼⾳频中

存在客⼾敏感信息造成泄露。

通过⼈⼯调听并剪辑的⽅式固然可⾏,但是需要耗费⼤量的⼈⼒成本。因此,需要通过某种技术⼿

段,实现批量将⾳频的关键信息进⾏脱敏操作。

⽅案具体怎么做?其实我⼀开始也不清楚,那不妨把需求提给⼤模型,来问问它建议怎么做。

⼆、⽅案实现

(⼀)借助TTSMaker⽣成模拟录⾳

为了⽅便演⽰,⾸先我们需要准备⼀通录⾳,其中包含了敏感信息,假设我们的敏感信息包括了三

类:

敏感信息

1.电话号码:例152-3463-2457

2.⾝份证号码:例

3.卡号:例如62220824187382833

以上举例均为模拟数据,如有雷同,纯属巧合。

我们通过TTSMaker⼯具来⽣成⼀段模拟录⾳,录⾳中会包含“⼿机号码”和“⾝份证号码”等敏感

信息(⾮真实数据),⽣成完成后进⾏保存。

input_audio

使⽤地址:/zh-cn

(⼆)与GPT-4o交互,获取⽅案及初版代码

接下来,我们来跟GPT-4o聊⼀聊,看看我们设想的批量处理录⾳脱敏的⽅案应该如何实现。

Round1

提问:我现在有⼀段⾳频,想识别出⾳频中的⾝份证号、⼿机号码、银⾏卡号等敏感信息,并做脱敏

处理,最后返回脱敏后的录⾳。请问该如何处理。

答复:GPT答复了主要的步骤:

1、⾳频转⽂字

2、⽂本中的敏感信息识别

3、⽂本脱敏处理

4、⽂本转⾳频

5、⽣成脱敏后的录⾳⽂件

细看⼀下思路挺不错的,但是这个⽅案会有⼀些问题,⽐如将脱敏后的⽂本使⽤TTS重新合成⾳频的

话,会改变原始录⾳的⾳⾊,这样不是很合适。于是,我们继续跟GPT-4o来聊。

Round2

提问:使⽤asr和tts的⽅式,会有⼀些问题,⽐如asr可能会识别错误,tts可能会引起新的录⾳与原始

录⾳⾳⾊不同等等。能否直接针对原始⾳频⽂件进⾏处理,即对有敏感信息部分的⾳频进⾏处理,其

余部分保持不变。

答复:GPT采纳了我的意⻅,新的操作步骤如下:

1、⾳频转⽂字(保持不变)

2、识别敏感信息并标注时间戳

3、根据时间戳处理⾳频

并给出了⼀个完整的实例代码。

不错,GPT的思路跟我设想的⽐较接近了,只不过这个⽅案还是依赖于ASR识别的准确率,没办法达到

100%准确,不过似乎也没有更好的解决⽅案。

我们看到代码中使⽤了google的Speech-to-Text服务,但是我想替换为openai的whisper-1。

Round3

提问:我希望使⽤openai的Speech-to-Text和Text-to-Speech服务,请调整代码。

答复:GPT很快给我⽣成了代码,细看⼀下,代码⽐较简单,主要三个函数。

transcribe_audio:把录⾳转为⽂本

find_sensitive_info:找到敏感信息

process_audio:处理⾳频(脱敏)

1deftransribe_audio(audio_path):

2withopen(audio_path,rb)asaudio_file:

3audio_ontent=audio_file.read()

4

5response=openai.Audio.transribe(

6model=whisper-1,

7file=audio_ontent,

8response_format=json

9)

10

11transripts=[]

12forsegmentinresponse[segments]:

13transripts.append({

14text:segment[text],

文档评论(0)

133****9720 + 关注
实名认证
内容提供者

物业管理师证持证人

该用户很懒,什么也没介绍

领域认证该用户于2023年04月23日上传了物业管理师证

1亿VIP精品文档

相关文档