- 6
- 0
- 约6.27千字
- 约 21页
- 2016-10-07 发布于天津
- 举报
數位訊號處理概論
將每一個音框乘上漢明窗,以增加音框左端和右端的連續性(請見下一個步驟的說明)。假設音框化的訊號為 S(n), n = 0,…N-1。那麼乘上漢明窗後為 S(n) = S(n)*W(n),此 W(n) 形式如下: W(n, a) = (1 - a) - a cos(2pn/(N-1)),0≦n≦N-1 * 在上述範例中,音框中的訊號是一段弦波加上雜訊,若不乘上漢明窗,音框的左端和右端並不連 續,因此在頻譜上,代表弦波的高峰比較不明顯。若乘上漢明窗後,雜訊在能量頻譜上面的強度就會比較弱,代表弦波的高峰也相對比較突出。如果我們使用實際的 聲音訊號來進行測試,漢明窗的效果就會更明顯: * 乘上漢明窗的主要目的,是要加強音框左端和右端的連續性,這是因為在進行 FFT 時,都是假設一個音框內的訊號是代表一個週期性訊號,如果這個週期性不存在,FFT 會為了要符合左右端不連續的變化,而產生一些不存在原訊號的能量分佈,造成分析上的誤差。當然,如果我們在取音框時,能夠使音框中的訊號就已經包含基本週 期的整數倍,這時候的音框左右端就會是連續的,那就可以不需要乘上漢明窗了。但是在實作上,由於基本週期的計算會需要額外的時間,而且也容易算錯,因此我 們都用漢明窗來達到類似的效果。 語音訊號在時域上變化十分的快速且會隨著時間不斷的改變,使得在時域上 沒有辦法作有效的觀察。可是在頻域上短時間內語音訊號是呈現週期性的,所以 一般會經由離散傅立葉轉換(Discrete Fourier Transform, DFT)把語音訊號由 時域轉成頻域[4]。 * 三角帶通濾波器有兩個主要目的: 1.對頻譜進行平滑化,並消除諧波的作用,突顯原先語音的共振峰。 (因此一段語音的音調或音高,是不會呈現在 MFCC 參數內,換句話說,以 MFCC 為特徵的語音辨識系統,並不會受到輸入語音的音調不同而有所影響。) 2.降低資料量。 * 模擬此人耳聽覺特性 梅爾頻率代表一般人耳對於頻率的感受度,由此也可以看出人耳對於頻率 f 的感受是呈對數變化的: 在低頻部分,人耳感受是比較敏銳 。在高頻部分,人耳的感受就會越來越粗糙 。 * 一個音框的音量(即能量),也是語音的重要特徵,而且非常容易計算。因此我們通常再加上一個 音框的對數能量(定義為一個音框內訊號的平方和,再取以 10 為底的對數值,再乘以 10),使得每一個音框基本的語音特徵就有 13 維,包含了 1 個對數能量和 12 個倒頻譜參數。(若要加入其他語音特徵以測試辨識率,也可以在此階段加入,這些常用的其他語音特徵,包含音高、過零率、共振峰等。) 人耳除了對於頻率的變化會隨著高頻而敏感度遞減,此外對於頻率能量的變 化也不敏感,這可以從三小聽骨的機制觀察到。人耳的外耳與中耳都是充滿空氣 而內耳卻是充滿液體,振動由空氣傳遞到液體會造成能量的損失,這時後三小聽 骨會利用槓桿原理在加上單位面積的不同來增加振動的傳送。此外,三小聽骨上 附有身體最小的骨骼肌,當有非常強大的巨響傳入,它會收縮以減低三小聽骨的 振動,藉此保護耳朵。因為模擬人耳的特性,所以一般會對梅爾三角濾波器輸出 的值作對數轉換[4]。 * 將上述的 20 個對數能量 Ek帶入離散餘弦轉換,求出 L 階的 Mel- scale Cepstrum 參數,這裡 L 通常取 12。離散餘弦轉換公式如下: Cm=Sk=1Ncos[m*(k-0.5)*p/N]*Ek, m=1,2, ..., L 其中 Ek 是由前一個步驟所算出來的三角濾波器和頻譜能量的內積值,N 是三角濾波器的個數。由於之前作了 FFT,所以採用 DCT 轉換是期望能轉回類似 Time Domain 的情況來看,又稱 Quefrency Domain,其實也就是 Cepstrum。又因為之前採用 Mel- Frequency 來轉換至梅爾頻率,所以才稱之Mel-scale Cepstrum。 * 聲紋辨識 100%自製 指導老師:趙春棠 學生:陳保均 學號大綱 DSP應用 生物辨識系統 聲紋辨識-處理過程 聲紋辨識缺點 DSP應用 語音方面: 語音分析/合成 語音辨識 語者辨識 噪音消除 聲紋辨識 加密/解密、T.T.S. (Text to Speech). DSP應用 控制方面: 交直流、伺服、步進、線性馬達 雕刻機 機器人 電動車 飛機及飛彈導航系統 半導體設備 DSP應用 影像應用方面: 影像辨識 醫學影像 生理影像監測 指紋辨識 虛擬實境(VR)、D3D、3D 圖型 飛行模擬 DSP應用 通訊方面應用: 加密/解密 廣播通訊 ADSL、I-Phone、Digital Radio 衛星通訊 視訊會議系統(Video Conference) 雷達/聲納
您可能关注的文档
- 手机滑盖试验机.doc
- 首都医科大学2012年硕士研究生第二轮调剂的通知.doc
- 首都医科大学附属北京友谊医院新增干部保健病房设备添.doc
- 首届荆州市突出贡献人才奖.doc
- 寿县县医院数字高清腹腔镜设备采购项目.doc
- 受高价原油提振,pta势不可挡.doc
- 受託研究契約書(標準様式).doc
- 受託研究費算定要領.doc
- 受託研究契約書(雛形).doc
- 授業科目-rdche.hit.doc
- 2025-2026学年天津市和平区高三(上)期末数学试卷(含解析).pdf
- 2025-2026学年云南省楚雄州高三(上)期末数学试卷(含答案).pdf
- 2025-2026学年甘肃省天水市张家川实验中学高三(上)期末数学试卷(含答案).docx
- 2025-2026学年福建省厦门市松柏中学高二(上)期末数学试卷(含答案).docx
- 2025-2026学年广西钦州市高一(上)期末物理试卷(含答案).docx
- 2025-2026学年河北省邯郸市临漳县九年级(上)期末化学试卷(含答案).docx
- 2025-2026学年河北省石家庄二十三中七年级(上)期末历史试卷(含答案).docx
- 2025-2026学年海南省五指山市九年级(上)期末化学试卷(含答案).docx
- 2025-2026学年河北省唐山市玉田县九年级(上)期末化学试卷(含答案).docx
- 2025-2026学年河北省邢台市市区九年级(上)期末化学试卷(含答案).docx
最近下载
- 心源性晕厥临床表现及护理.pptx VIP
- 食物不耐受IgG解读.pptx
- 2021 固态锂电池用固态电解质性能要求及测试方法 无机氧化物固态电解质.docx VIP
- 毕业论文(设计)小型混凝土搅拌机设计.doc VIP
- 人教版(2024)新教材八年级数学下册第20章20.1 勾股定理及其应用每课时教学设计汇编(含三个教学设计).docx VIP
- 2025CSCO前列腺癌诊疗指南更新解读(全文).pdf VIP
- 湘教版(2024)新教材八年级地理下册第六章第二节《东北地区的人口与城乡分布》精品教学设计.docx VIP
- 山西省2024年中考英语模拟试卷(含答案)2.pdf VIP
- 2025年食品安全国家标准-食品生产卫生规范GB14881培训考试试题及参考答案.docx VIP
- 语文 《红楼梦》阅读中“选择题”解题技巧阐释与训练 2024-2025学年统编版高一语文必修下册.docx VIP
原创力文档

文档评论(0)