- 3
- 0
- 约小于1千字
- 约 5页
- 2016-09-21 发布于天津
- 举报
非定常雑音環境に頑健な音声認識手法の検討
突発性雑音環境下での音声認識における欠損領域予測?補間手法の検討 白井研究室 学部4年 篠井 暖 研究背景と目的 現在の音声認識システムは実環境での認識精度に問題(非定常雑音への対応が不十分) 実環境の様々な雑音に対応した音声認識技術の必要性 人間の聴覚は非定常雑音に対しても頑健 (非欠損領域より欠損領域を予測) 対象とするケース:時間突発的な雑音により音声のある時間領域で周波数情報が全て欠損 欠損領域補間手法 狭帯域信号における線形予測法 音声信号を帯域分割し狭帯域信号を作成 狭帯域信号の包絡線と搬送波それぞれについて線形予測を行い欠損領域を補間 補間後の狭帯域信号を用いて音声を復元 評価実験 提案手法の有効性を客観評価(音声認識実験)と主観評価(試聴実験)の両面から評価 試聴実験を行う理由 音声認識率向上と同時に、人間も聴き取りやすくなっているか調べる 音声認識器による認識率と人間の聴覚による認識率を比較 評価実験結果 客観評価実験結果 * * 欠損領域の予測?補間により音声認識精度の向上を図る 欠損領域の前後の信号から予測を行う必要性 時間信号 … 狭帯域信号 線形予測 狭帯域信号(補間後) 狭帯域信号 線形予測 狭帯域信号(補間後) 狭帯域信号 線形予測 狭帯域信号(補間後) 時間信号 (補間後) 160msで約10%の認識率向上
您可能关注的文档
- 第四章實體層.ppt
- 第四章压力容器.ppt
- 第五讲19世纪上半叶美国的领土扩张和对外政策.ppt
- 第五章步进电动机及其控制5.1概述.ppt
- 第五章电化学原理及应用.ppt
- 第五章非營利組織的人力資源管理.ppt
- 第五章线性定常系统的设计.ppt
- 第一次labview就上手.ppt
- 第一个走出中国国门的女画家.ppt
- 第一單元概說廣告.ppt
- 2025-2026学年天津市和平区高三(上)期末数学试卷(含解析).pdf
- 2025-2026学年云南省楚雄州高三(上)期末数学试卷(含答案).pdf
- 2025-2026学年甘肃省天水市张家川实验中学高三(上)期末数学试卷(含答案).docx
- 2025-2026学年福建省厦门市松柏中学高二(上)期末数学试卷(含答案).docx
- 2025-2026学年广西钦州市高一(上)期末物理试卷(含答案).docx
- 2025-2026学年河北省邯郸市临漳县九年级(上)期末化学试卷(含答案).docx
- 2025-2026学年河北省石家庄二十三中七年级(上)期末历史试卷(含答案).docx
- 2025-2026学年海南省五指山市九年级(上)期末化学试卷(含答案).docx
- 2025-2026学年河北省唐山市玉田县九年级(上)期末化学试卷(含答案).docx
- 2025-2026学年河北省邢台市市区九年级(上)期末化学试卷(含答案).docx
原创力文档

文档评论(0)