- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《数字信号处理B》课程项目
实施报告
题 目 数字音效处理器 组 号: 23 任课教师: 朱雯君 组 长:1座机电话号码 王江锋 20% 成 员:1座机电话号码 方毅仁 20% 成 员:1座机电话号码 姜雯雯 20% 成 员:1座机电话号码 张飞鸿 20% 成 员:1座机电话号码 石茜茜 20% 联系方式: 1座机电话号码78 2015 年 10 月 24 日
一、课程项目内容介绍
1.设计要求:
设计一个数字音效处理器,能够实现语音信号的各种音效处理。要求:
输入语音信号源为实际环境采集语音;
至少实现3种音效处理功能(其中至少包括下述2种功能:1、项目组5人的语音识别;2、10秒以上的实际语音至少3种类型噪声的降除);
用人机交互界面操控、扬声器/耳机输出音效。
2.评分依据:
功能实现;
性能指标;
工程规范(规范、展示性、可靠性、复杂度等);
理论水平;
团队分工合作情况。
二、课程项目总体实施设想
根据对项目的理解,我们将项目具体分为三个部分逐步完成——基础语音识别、有噪声的语音识别、语音音效处理。
三、课程项目实施理论依据
基础语音识别
根据我们所搜集的资料以及自学的知识,语音识别根据说话人的语音信号来判别说话人的身份。根据每个说话人发音器官的生理差异以及后天形成的行为差异,每个人的语音都带有强烈的个人色彩,所以通过分析语音信号来识别说话人就成了一个可以实现的过程。而且用语音来鉴别说话人的身份具有很多独特的优点。作为人的固有的特征,语音信号是不会丢失或遗忘的。语音信号的采集又非常的方便,实现起来非常便捷。语音识别的基本过程如下图。我们采用的是GMM-HMM语音识别。
GMM-HMM语音识别
1)将waveform切成等长frames,对每个frame提取特征(e.g. MFCC),
2)对每个frame的特征跑GMM,得到每个frame(o_i)属于每个状态的概率b_state(o_i)
fig6. complete process from speech frames to a state sequence
3)根据每个语音的HMM状态转移概率a计算每个状态sequence生成该frame的概率; 哪个词的HMM?序列跑出来概率最大,就判断这段语音属于语音
宏观图:
fig7. Speech recognition, a big framework
GMM参数:高斯分布参数:
从上面fig4下面的公式我们已经可以看出来想求参数必须要知道P(j|x),即,x属于第j个高斯的概率。怎么求捏?
fig8. bayesian formula of P( j | x )
根据上图 P(j | x), 我们需要求P(x|j)和P(j)去估计P(j|x)。
这里由于P(x|j)和P(j)都不知道,需要用EM算法迭代估计以最大化P(x) P(x1)*p(x2)*.。.*P(xn):
A. 初始化(可以用kmeans)得到P(j)
B. 迭代
E(estimate)-step: 根据当前参数 (means, variances, mixing parameters)估计P(j|x)
M(maximization)-step: 根据当前P(j|x) 计算GMM参数(根据fig4 下面的公式:) 其中 前面已经有了GMM的training过程。在这一步,我们的目标是:从observation序列中估计HMM参数λ;
假设状态- observation服从单核高斯概率分布: 则λ由两部分组成:
HMM训练过程:迭代
E(estimate)-step: 给定observation序列,估计时刻t处于状态sj的概率 M(maximization)-step: 根据重新估计HMM参数aij.
其中,
E-step: 给定observation序列,估计时刻t处于状态sj的概率 为了估计, 定义: t时刻处于状态sj的话,t时刻未来observation的概率。即
这个可以递归计算:β_t(si) 从状态 si 转移到其他状态 sj 的概率aij * 状态 i 下观测到x_ t+1 的概率bi(x_ t+1 ) * t时刻处于状态sj的话 t+1 后observation概率β_ t+1 (sj)
即:
定义刚才的为state occupation probability,表示给定observation序列,时刻t处于状态sj的概率P(S(t) sj | X,λ) 。根据贝叶斯公式p(A|B,C) P(A,B|C)/P(B|C),有:
由于分子p(A,B|C)为
其中,αt(sj)表示HMM在时刻t
您可能关注的文档
最近下载
- 制定手机使用协议书.docx VIP
- 隐形矫正培训课件.pptx VIP
- 2025年高考化学一轮复习:物质的分类及转化(讲义)解析版.pdf VIP
- 2023中华护理学会团体标准-老年人误吸的预防.pptx VIP
- 《Rubis软件2017版》操作手册.pdf VIP
- 标准图集-08CJ17快速软帘卷门 透明分节门 滑升门 卷帘门.pdf VIP
- 消化内科-病历讨论.pptx VIP
- (⼈教2019版)化学 选必1 第三单元 水溶液中的离子反应与平衡 大单元教学设计.docx
- SHT 3525-2015 石油化工低温钢焊接规范.pdf VIP
- Q/CRRC J26-2018- 轨道交通装备产品禁用和限用物质.pdf VIP
文档评论(0)