- 5
- 0
- 约5.65千字
- 约 5页
- 2017-08-22 发布于重庆
- 举报
使用潜在狄利克雷分解的单声道说话人分离.doc
使用潜在狄利克雷分解的单声道说话人分离
摘要:我们提出了一种使用声谱图的潜在变量分解算法,来从混合的单声道录音里分离出多个说话人。我们将语音信号短时傅立叶变换的每一个幅度谱分量建模成一个离散随机过程的输出。这个离散随机过程产生一系列频率分辨率分量。这个过程被建模成混合多项式分布,这些分量多项式的混合权重在不同的分析窗间变化。这些分量多项式可以认为是属于特定说话人的,而且可以通过对每一个说话人训练信号来得到。我们把每一个说话人的混合权重的先验分布建模成一个狄利克雷分布。代表混合信号幅度谱分量的分布被分解成所有单个说话人多项式分布的混合。通过这种分解,频率分布,或者说每一个说话人的语音频谱将得到重建。
简介
对于单声道说话人的分离问题,比如说从有几个人说话的单声道录音里分离出当前说话人的问题,历史上一直是考虑从频率选择的角度来解决的。为了分离出每一个说话人的语音信号,需要从不完整的视频序列里,重建出混合信号中的受说话人控制的时频分量。对说话人的时频分量的选择在实际中可能是基于感知原理的(如文献【1】),或者是基于统计模型的(如文献【2】),也可能是基于二进制或者概率性的(如文献【3】)。
在这篇论文中,我们采用了一种可变的方法,试图为每一个说话人重建全部的频谱,而不是得到部分的频谱描述。特别地,在这种方法中,对每一个说话人,典型的短时谱结构,或者说短时基,从训练数据中学习的到。混合信号
您可能关注的文档
- 《硫酸的制备和性质》教学设计.doc
- 《等腰三角形的判定》教学反思.doc
- 《营销人员的薪酬激励体系的设计》.doc
- 《表面粗糙度》.doc
- 《财务管理实务》课程之案例教学的创新实践浙江商业职业.doc
- 《轨道交通控制系统》学习指导书.doc
- 《辐射供暖装置节能产品认证技术规范》(申请备案稿)编制说明.doc
- 《运动训练学》习题.doc
- 《近代史专题——工业文明的崛起对中国社会经济的冲击》学案.doc
- 《通过民乐教学培养幼儿的创新能力》研究报告.doc
- 2026年山东省滨州市惠民县中考化学一模试卷(含答案).pdf
- 2026年山东省济南市历城区中考化学二模试卷(含答案).pdf
- 2026年山东省烟台市福山区中考化学模拟试卷(含答案).pdf
- 2026年山东省临沂市郯城县中考化学一模(含答案).pdf
- 2026年四川省德阳市中江县中考化学二诊试卷(含答案).pdf
- 2026年四川省绵阳市梓潼县中考化学二模试卷(含答案).pdf
- 2026年新疆乌鲁木齐市沙依巴克区中考化学适应性试卷(含答案).pdf
- 2026年重庆市永川区中考化学质检试卷(含答案).pdf
- 2026年重庆市第一中学校中考化学全真模拟试卷(二)(含答案).pdf
- 安徽池州市第二中学等校2025-2026学年高一下学期期中物理试卷A(含答案).pdf
原创力文档

文档评论(0)