CN111164682B 使用机器学习的音频重建方法和设备 (三星电子株式会社).docxVIP

  • 0
  • 0
  • 约4.18万字
  • 约 71页
  • 2026-01-15 发布于重庆
  • 举报

CN111164682B 使用机器学习的音频重建方法和设备 (三星电子株式会社).docx

(19)国家知识产权局

(12)发明专利

(10)授权公告号CN111164682B(45)授权公告日2025.07.04

(21)申请号201780095363.X

(22)申请日2017.10.24

(65)同一申请的已公布的文献号申请公布号CN111164682A

(43)申请公布日2020.05.15

(85)PCT国际申请进入国家阶段日

2020.03.27

(86)PCT国际申请的申请数据

PCT/KR2017/0117862017.10.24

(87)PCT国际申请的公布数据

WO2019/083055KO2019.05.02

(73)专利权人三星电子株式会社地址韩国京畿道

(72)发明人成昊相郑钟勋朱基岘吴殷美

柳宗烨

(74)专利代理机构北京市立方律师事务所

11330

专利代理师谢玉斌周永佳

(51)Int.CI.

G10L19/16(2013.01)

G10L19/00(2013.01)

G10L21/038(2013.01)

G10L25/30(2013.01)

(56)对比文件

US2016093308A1,2016.03.31WO2009114656A1,2009.09.17

审查员汪灵廪

权利要求书2页说明书22页附图14页

(54)发明名称

开始

开始

获得多个解码参数710

确定第二参数的特性720

获得重建的第二参数730

获得校正后的第二参数740

解码音频信号750

结束

(57)摘要

CN111164682B提供了一种音频重建方法和设备,用于通过机器学习来重构从比特流获得的解码参数或音频信号来提供改进的声音质量。该音频重建方法包括:通过解码比特流获得当前帧的多个解码参数;基于包括在所述多个解码参数中的第一参数,确定包括在所述多个解码参数中并与所述第一参数相关联的第二参数的特性;通过将机器学习模型应用于所述多个解码参数中的至少一个、第二参数和第二参数的特性来获得重建的第二参数;以及基于所述重建的第二参数解码音频信

CN111164682B

CN111164682B权利要求书1/2页

2

1.一种音频信号重建方法,所述方法包括:

通过解码包括音频信号的比特流获得根据当前帧中的频率的信号幅度;

基于对应于与第一频率相邻的频率的信号幅度,确定在所述第一频率处的信号幅度的

范围;

通过将机器学习模型应用于在所述第一频率处的所述信号幅度的所述范围以及根据所述频率的所述信号幅度来获得重建的在所述第一频率处的信号幅度;以及

基于所述重建的在所述第一频率处的信号幅度来解码来自所述比特流的所述当前帧的所述音频信号。

2.根据权利要求1所述的音频信号重建方法,其中,解码所述音频信号包括:

通过将所述重建的在所述第一频率处的信号幅度校正为处于在所述第一频率处的所述信号幅度的所述范围内,获得校正后的在所述第一频率处的信号幅度;以及

基于所述校正后的信号幅度解码所述音频信号。

3.根据权利要求2所述的音频信号重建方法,

其中,获得所述校正后的信号幅度包括:当所述重建的信号幅度不在所述范围内时,获得所述范围内的最接近所述重建的信号幅度的值作为所述校正后的信号幅度。

4.根据权利要求1所述的音频信号重建方法,其中,确定在所述第一频率处的所述信号幅度的所述范围包括:通过使用基于根据所述频率的所述信号幅度而预训练的机器学习模型来确定在所述第一频率处的所述信号幅度的所述范围。

5.根据权利要求1所述的音频信号重建方法,其中,获得所述重建的在所述第一频率处的信号幅度包括:

基于所述范围确定在所述第一频率处的所述信号幅度的候选;以及

基于所述机器学习模型,选择在所述第一频率处的所述信号幅度的所述候选中的一个候选。

6.根据权利要求1所述的音频信号重建方法,其中,获得所述重建的在所述第一频率处的信号幅度包括:进一步基于前一帧的多个解码参数中的至少一个解码参数,获得所述当前帧的所述重建的在所述第一频率处的信号幅度。

7.根据权利要求1所述的音频信号重建方法,其中,所述机器学习模型是通过机器学

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档