- 0
- 0
- 约1.8万字
- 约 26页
- 2026-01-15 发布于重庆
- 举报
(19)国家知识产权局
(12)发明专利
(10)授权公告号CN114067793B(45)授权公告日2025.07.04
(21)申请号202111302400.4
(22)申请日2021.11.04
(65)同一申请的已公布的文献号申请公布号CN114067793A
(43)申请公布日2022.02.18
(73)专利权人北京百度网讯科技有限公司
地址100085北京市海淀区上地十街10号
百度大厦2层
(72)发明人赵情恩
(74)专利代理机构北京猷德知识产权代理有限公司16084
专利代理师范继晨
(51)Int.CI.
G1OL15/22(2006.01)
G1OL15/02(2006.01)
G10L15/16(2006.01)
G10L21/0272(2013.01)
G10L21/0308(2013.01)
G10L25/30(2013.01)
(56)对比文件
CN107919133A,2018.04.17
CN111986680A,2020.11.24审查员陈成
权利要求书2页说明书9页附图3页
(54)发明名称
音频处理方法和装置、电子设备及可读存储介质
(57)摘要
CN114067793B本公开提供了一种音频处理方法和装置、电子设备及可读存储介质,涉及语音处理技术领域,尤其涉及人工智能、语音技术、深度学习领域。具体实现方案为:获取待处理音频,其中,待处理音频包括:从多个声源采集到的初始音频数据,多个声源对应于多个对象;对待处理音频进行内容识别,得到内容向量和内容向量对应的时间信息;基于内容向量和时间信息对待处理音频进行分离,得到分离结果,其中,分离结果用于从初始音频数据中确定多个对象中每个对象分别对应的目标音频数据。通过上述实现方案,本公开达到了提高分离结果的准确性,增加整体特征
CN114067793B
获取待处理音频
对待处理音频进行内容识别,得到内容向量和内容向量对应的时间信息
基于内容向量和时间信息对待处理音频进行分离,得到分离结果
S102
S104
S106
CN114067793B权利要求书1/2页
2
1.一种音频处理方法,包括:
获取待处理音频,其中,所述待处理音频包括:从多个声源采集到的初始音频数据,所述多个声源对应于多个对象;
对所述待处理音频进行内容识别,得到内容向量和所述内容向量对应的时间信息;
基于所述内容向量和所述时间信息对所述待处理音频进行分离,得到分离结果,其中,所述分离结果用于从所述初始音频数据中确定所述多个对象中每个对象分别对应的目标音频数据;
其中,所述内容向量包括:预设粒度的多个文本的特征向量,所述时间信息包括:所述多个文本的时间戳,所述基于所述内容向量和所述时间信息对所述待处理音频进行分离,得到分离结果包括:基于每个文本的时间戳对所述待处理音频进行切割,得到多个目标音频;基于所述多个文本的特征向量对所述多个目标音频进行分离,得到所述分离结果;
其中,音频分离模型至少包括:第一层双向长短时记忆模型和第二层双向长短时记忆模型,基于所述多个文本的特征向量对所述多个目标音频进行分离,得到所述分离结果,包括:将所述多个目标音频输入至所述第一层双向长短时记忆模型进行处理,得到第一输出向量;将所述第一输出向量和所述多个文本的特征向量进行拼接,得到拼接向量;将所述拼接向量输入至所述第二层双向长短时记忆模型进行处理,得到所述分离结果。
2.根据权利要求1所述的方法,其中,所述对所述待处理音频进行内容识别,得到内容向量和所述时间信息包括:
利用强制对齐模型对所述待处理音频进行识别,得到文本信息和所述时间信息;
利用特征生成模型对所述文本信息进行特征提取,得到所述内容向量。
3.根据权利要求1或2所述的方法,还包括:
获取训练样本,其中,所述训练样本包括训练音频和所述训练音频对应的标注结果,所述训练音频包括:从多个训练声源采集到的音频数据,所述多个训练声源对应于多个训练对象;
对所述训练音频进行内容识别,得到所述训练音频对应的训练向量和所述训练向量对应的时间信息;
基于所述训练向量和所述训练向量对应的时间信息对所述训练音频进行分离,得到第一预测结果,其中,所述第一预测结果用于表征所述训练向量对应的训练对象的概率;
您可能关注的文档
- CN113194821B 逆转替卡格雷活性的方法 (顺孚嘉第十制药股份有限公司).docx
- CN113247704B 一种化纤poy丝锭全自动智能上料设备和上料方法 (北京机科国创轻量化科学研究院有限公司).docx
- CN113257789B 集成芯片、晶片结合的方法以及在晶片上形成标记的方法 (台湾积体电路制造股份有限公司).docx
- CN113258779B 集成电路、反激式变换器及其控制电路和方法 (意法半导体股份有限公司).docx
- CN113298610B 信息推荐与获取方法、设备及存储介质 (阿里巴巴集团控股有限公司).docx
- CN113384693B Fcrn抗体及其使用方法 (动量制药公司).docx
- CN113442808B 车辆及其控制方法 (现代自动车株式会社).docx
- CN113473613B 由用户设备执行的方法以及用户设备 (夏普株式会社).docx
- CN113496522B 一种对包含音圈电机的镜头模组进行标定的方法及装置 (支付宝(杭州)信息技术有限公司).docx
- CN113516331B 一种建筑数据处理方法及装置 (腾讯科技(深圳)有限公司).docx
- CN114079769B 视频编码方法、装置、设备及计算机可读存储介质 (腾讯科技(深圳)有限公司).docx
- CN114090908B 一种路网数据的处理方法和装置 (广州小鹏汽车科技有限公司).docx
- CN114091045B 保护隐私的信息查询方法、装置、系统、设备及存储介质 (神州融安数字科技(北京)有限公司).docx
- CN114094825B 电子转换器的控制电路、相关集成电路、电子转换器和方法 (意法半导体股份有限公司).docx
- CN114095687B 视音频会议设备、终端设备、声源定位方法和介质 (杭州中天微系统有限公司).docx
- CN114116014B 一种指令下发方法、装置、智能设备及存储介质 (深圳Tcl新技术有限公司).docx
- CN114116899B 一种基于区块链的卫星集群分布式数据安全存储方法 (西安微电子技术研究所).docx
- CN114117412B 一种基于可信技术的虚拟加密机平台及其创建方法 (中国互联网络信息中心).docx
- CN114126524B 等离子体外科手术仪器和等离子体生成方法 (厄比电子医学有限责任公司).docx
- CN114126699B 经间隔系统、装置和方法 (波士顿科学医疗设备有限公司).docx
最近下载
- 变电站综合自动化系统的自动控制装置—备用电源自动投入装置.pptx
- GB_T 34549-2024 卫生洁具 智能坐便器.pdf VIP
- 2025届江苏省南京玄武外国语学校八年级数学第一学期期末学业质量监测模拟试题含解析.doc VIP
- 无人机精准测绘技术规范.pdf
- 《带式输送机 跑偏开关》标准全文及编制说明.doc VIP
- 安徽省芜湖市无为市2022-2023学年七年级上学期期末地理试卷.pdf VIP
- 四川某稀土矿选矿工艺试验.pdf VIP
- 南开大学复习资料-外贸单证实务.docx VIP
- 2026年消毒供应中心工作计划.docx
- 〖GB_T51301-2018〗建筑信息模型设计交付标准.docx VIP
原创力文档

文档评论(0)