語音辨識前處理介紹.pptVIP

  1. 1、本文档共15页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
語音辨識前處理介紹.ppt

語音辨識前處理介紹 Jain-De,Lee 大綱 預強調 音框化 端點偵測 窗函數 預強調 為了補償語音在空氣傳送中,所衰減的高頻訊號,故將語音訊號 s(n) 通過一個高通濾波器,其公式為: 此濾波器有+6dB/oct 高頻增強的特性,故語音訊號通過此高通濾波器結果為: 其中a為一個0.9 ~ 1.0之間的值 預強調 音框化 對於語音的離散時間訊號s(n),利用一個固定長度的視窗(Window)套上,並對視窗內的訊號做運算(如:取語音特徵),此行為稱加視窗,而套上的語音訊號稱音框(Frame) 通常視窗長度為20~30ms之間 舉例來說,取樣頻率22050Hz,若取視窗長度512點 512 / 22050 ≈ 23.22ms 音框化 為了保有語音訊號改變的延續性,通常會讓前後音框部分重疊,一般會重疊1/3或1/2個音框長度 取音框示意圖 端點偵測 一段語音檔案中,並不是所有的部分都是有效的訊號,因此必須經由端點偵測來判定有聲區段與無聲區段,其優點能讓系統提升效率及辨識率 有效聲段 端點偵測 一般端點偵測-絕對值能量法、平方和能量法 絕對值能量法: 其中E(n)為第n 個分析框的能量估算值,p 為該分析框的中心點位置,N 為分析框寬度 端點偵測 平方和能量法: 其中E(n)為第n 個分析框的能量估算值,p 為該分析框的中心點位置,N 為分析框寬度 端點偵測 基本頻譜熵值: 其中,pi(fm)為第i個音框下頻率fm的能量所佔比例,E(fm)為頻率m的能量大小,M為傅立葉轉換點數 其中,Hi為第i個音框下的負熵值, pi(fm)為第i個音框下頻率fm的能量所佔比例 端點偵測 平均能量熵值: 計算整段平均能量 其中,u為整段訊號的平均能量點,A(n)為第n個點的振幅值,N為訊號總點數 將平均能量加入機率密度 其中,β為調整值 端點偵測 計算加入平均能量後的負熵值 其中,Hi’為第i個音框下重新計算後的負熵值 窗函數 為了消除視窗兩邊的訊號的不連續,通常會加上漢明窗(Hamming Window),其公式為: 良好窗函數的頻率響應 主葉(Main lobe)頻帶要窄 旁葉(Side-lobe)與主葉差距大 otherwise 窗函數 常見窗函數: 窗函數 窗函數的頻率響應 * * * *

文档评论(0)

zhangningclb + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档