数字信号处理B项目案例.docVIP

下载本文档

27
0
约 71页
2017-03-14 发布于湖北
举报
版权申诉

数字信号处理B项目案例.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

《数字信号处理B》课程项目实施报告题目数字音效处理器组号： 23 任课教师：朱雯君组长：1座机电话号码王江锋 20% 成员：1座机电话号码方毅仁 20% 成员：1座机电话号码姜雯雯 20% 成员：1座机电话号码张飞鸿 20% 成员：1座机电话号码石茜茜 20% 联系方式： 1座机电话号码78 2015 年 10 月 24 日一、课程项目内容介绍 1.设计要求：设计一个数字音效处理器，能够实现语音信号的各种音效处理。要求：输入语音信号源为实际环境采集语音；至少实现3种音效处理功能（其中至少包括下述2种功能：1、项目组5人的语音识别；2、10秒以上的实际语音至少3种类型噪声的降除）；用人机交互界面操控、扬声器/耳机输出音效。 2.评分依据：功能实现；性能指标；工程规范（规范、展示性、可靠性、复杂度等）；理论水平；团队分工合作情况。二、课程项目总体实施设想根据对项目的理解，我们将项目具体分为三个部分逐步完成——基础语音识别、有噪声的语音识别、语音音效处理。三、课程项目实施理论依据基础语音识别根据我们所搜集的资料以及自学的知识，语音识别根据说话人的语音信号来判别说话人的身份。根据每个说话人发音器官的生理差异以及后天形成的行为差异，每个人的语音都带有强烈的个人色彩，所以通过分析语音信号来识别说话人就成了一个可以实现的过程。而且用语音来鉴别说话人的身份具有很多独特的优点。作为人的固有的特征，语音信号是不会丢失或遗忘的。语音信号的采集又非常的方便，实现起来非常便捷。语音识别的基本过程如下图。我们采用的是GMM-HMM语音识别。 GMM-HMM语音识别 1）将waveform切成等长frames，对每个frame提取特征（e.g. MFCC），　　2）对每个frame的特征跑GMM，得到每个frame（o_i）属于每个状态的概率b_state（o_i）　　fig6. complete process from speech frames to a state sequence 　　3）根据每个语音的HMM状态转移概率a计算每个状态sequence生成该frame的概率; 哪个词的HMM?序列跑出来概率最大，就判断这段语音属于语音　　宏观图：　　fig7. Speech recognition， a big framework GMM参数：高斯分布参数：　　从上面fig4下面的公式我们已经可以看出来想求参数必须要知道P（j|x），即，x属于第j个高斯的概率。怎么求捏？　　fig8. bayesian formula of P（ j | x ）　　根据上图 P（j | x），我们需要求P（x|j）和P（j）去估计P（j|x）。　　这里由于P（x|j）和P（j）都不知道，需要用EM算法迭代估计以最大化P（x） P（x1）*p（x2）*.。.*P（xn）：　　A. 初始化（可以用kmeans）得到P（j）　　B. 迭代　　E（estimate）-step：根据当前参数（means， variances， mixing parameters）估计P（j|x）　　M（maximization）-step：根据当前P（j|x）计算GMM参数（根据fig4 下面的公式：）其中前面已经有了GMM的training过程。在这一步，我们的目标是：从observation序列中估计HMM参数λ；　　假设状态- observation服从单核高斯概率分布：　　则λ由两部分组成：　　HMM训练过程：迭代　　E（estimate）-step：给定observation序列，估计时刻t处于状态sj的概率 M（maximization）-step：根据重新估计HMM参数aij. 　　其中，　　E-step：给定observation序列，估计时刻t处于状态sj的概率为了估计，定义： t时刻处于状态sj的话，t时刻未来observation的概率。即　　这个可以递归计算：β_t（si）从状态 si 转移到其他状态 sj 的概率aij * 状态 i 下观测到x_ t+1 的概率bi（x_ t+1 ） * t时刻处于状态sj的话 t+1 后observation概率β_ t+1 （sj）　　即：　　定义刚才的为state occupation probability，表示给定observation序列，时刻t处于状态sj的概率P（S（t） sj | X，λ）。根据贝叶斯公式p（A|B，C） P（A，B|C）/P（B|C），有：　　由于分子p（A，B|C）为　　其中，αt（sj）表示HMM在时刻t