- 0
- 0
- 约2.12万字
- 约 4页
- 2026-02-27 发布于北京
- 举报
返回耳朵:感知驱动的高保真音乐重构
KangdiWangZhiyueWuDinghaoZhouRuiLinJunyuDaiTaoJiang
ar-LABiniti-AILtd
CoreContributionCorrespondingAuthorProjectLead
ABSTRACT为了解决这些问题,我们引入了自动编码变分自编码器,
一个优化高保真音乐重建的开源VAE模型。我们的模型包含
变分自编码器(VAEs)对于大型音频任务如基于扩散的生成至了一个K加权感知滤波器,我们证明它比A加权更适用于音
关重要。然而,现有的开源模型在训练过程中往往忽视了听觉乐信号的心理声学特性。为了确保相位一致性,我们提出了新
感知方面的因素,导致相位准确性和立体声空间表示存在不足。的损失函数,通过监督其导数(IFGD)来隐式优化相位性
为了解决这些问题,我们提出了自编码变分自动编码器,能。此外,我们采用了一种新的Mid/Side/Left/Right(MSLR)
一种重新思考并优化VAE训练范式的开放源代码音乐信号重权重方案进行重建损失的应用,以最大化空间和频谱细节的保
建模型。我们的贡献有三个方面:(i)在损失计算之前应用K留。通过这些针对性的设计,自编码变分自回归模型在多个
本加权感知滤波器以使目标与听觉感知保持一致。(ii)两种新颖客观评估中实现了最先进的重建性能,为开源高保真音频VAE
的相位损失:用于立体声相干性的相关性损失,以及利用其导设定了新的基准。
译数——瞬时频率和群延迟——来提高精确度的相位损失。(iii)我们总结我们的贡献如下:首先,我们将K加权滤波器分
中一个新的光谱监督范式,在该范式中,幅度由所有四个MSLR析并整合到VAE训练管道中,将重建目标与音乐感知的心理
(中间/侧面/左/右)组件进行监督,而相位仅由LR组件监督。声学对齐,这与常用的A加权不同。
1实验显示自编码器-变分自编码器在44.1kHz下在各种指其次,我们提出了新型相位感知损失函数,监督相位导数
v标上显著优于领先的开源模型,尤其是在重构高频谐波和空间以隐式建模关键相位差异,从而增强瞬态清晰度和相位一致性。
2特征方面表现出色。第三,我们引入了一种新的监督策略,分别约束幅度和相
1IndexTe
您可能关注的文档
- 显式与隐式传记:评估和调整基于 Wikidata 的文本中的 LLM 信息提取.pdf
- 变压器模型在社交机器人检测中的比较分析.pdf
- 计算机辅助设计驱动的飞行准备型喷气动力仿人机器人协同设计.pdf
- 通过反记忆化指导减轻文本到音频生成扩散模型中的数据复制问题.pdf
- 跨模态知识蒸馏在语音大型语言模型中的应用.pdf
- GenKOL: 模块化生成 AI 框架用于可扩展虚拟 KOL 生成.pdf
- 自解释强化学习在 移动网络资源分配中的应用.pdf
- 成本性能分析:基于 CPU 的无服务器和基于 GPU 的训练架构的比较研究.pdf
- 人工智能与市场新进入者游戏开发者.pdf
- 伪标签增强级联框架:LSVOS 2025 VOS 赛道第二次技术报告.pdf
- 2026年中国微型车专用机油市场调查研究报告.docx
- 2026年中国自动化工程设备市场调查研究报告.docx
- 2026年中国气门座铰磨拉镗压组合工具市场调查研究报告.docx
- 2026年学历类自考专业(电子商务)网络营销与策划-互联网数据库参考题库含答案解析(5卷答案).docx
- 2026年中国ABS床头柜市场调查研究报告.docx
- 2026年中国无动发电机组市场调查研究报告.docx
- 2026年中国不锈钢罐顶安全装置市场调查研究报告.docx
- 2026年中国自动上料搅拌罐市场调查研究报告.docx
- 2026年中国不锈钢取样阀市场调查研究报告.docx
- 2026年中国咖啡豆油市场调查研究报告.docx
最近下载
- (最新)ISO 55013-2024 资产管理-数据资产管理指南(中文版-翻译-2024)(推荐下载).pdf VIP
- (QC小组活动专业能力)中级质量专业能力考试题库及答案.docx VIP
- 固体物理第一章晶体结构.pptx VIP
- 聚集性事件、药品群体不良事件调查处置标准操作规程.docx VIP
- DB52T 1692-2022 水利工程标识标牌技术规范.pdf VIP
- 2026年qc诊断师中级考试题库及答案.docx VIP
- 北航机械设计课程设计设计计算说明书.docx VIP
- (项目部)应急预案演练总结及评估报告.docx VIP
- 最新领军人才项目申报答辩汇报PPT模板.pptx VIP
- 2025年增资协议中英.doc
原创力文档

文档评论(0)