- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Study on Separating Mixed Frog Sounds Using
Sparse Non-negative Matrix Factor 2-D
Deconvolution Combined With Mask
Wen-Ping Chen1,*, Cheng Chung Chang1, HYPERLINK .tw/ec/ecjnlSearchResult.aspx?st=asc=ask=%e5%91%a8%e5%af%8c%e4%b8%89so=tsl=allsat=allsdo=allpg_size=20sys=sms=sye=sme=st1=st2=st3=sf1=sf2=sf3=sc1=sc2=smode=dtype=1sysid=1sysl=CH Fu-Shan Chou2, Ya-Zhung Chen1, and
Wen-Chih Lin2
1Department of Electrical Engineering, National Kaohsiung
2Liu-Kuei Research Center, Taiwan Forestry Research Institute
E-mail: pen@.tw
摘要 (Abstract)
傳統生態調查皆以耗時又費力的人力方式進行,所幸在資通訊技術的蓬勃發展下,野外自動錄音方式已取而代之。然而錄製的龐大聲景資料量卻形成人員分析上的困擾,因此專家學者紛紛以聲紋辨識技術來解決,其中動態時軸扭曲法(Dynamic Time Warping, DTW)、支持向量機(Support Vector Machines, SVM)與整體平均聲紋頻譜法(Spectral Ensemble Average Voice Prints, SEAV)常被應用於聲紋辨識上,但當聲紋的頻率變化較豐富時,其辨識效果將大受影響。故本文提出一種多段式平均頻譜法(Multi-Stage Average Spectrum, MSAS)以提升辨識效果,此法結合音節長度特徵分類 (Feature Classification of Syllable Length)可更加提升辨識系統的成效。在17種蛙類,660個蛙鳴測試音節的實驗中發現,本文所提之方法將比DTW、SVM與SEAV等方法具有更優異的辨識能力。
關鍵詞:聲紋辨識(Speaker Recognition)、動態時軸扭曲(Dynamic Time Warping)、支持向量機(Support Vector Machines)、多段式平均頻譜法(Multi-Stage Average Spectrum)
前言 (Introduction)
聲紋辨識技術日趨成熟,然而在野外所錄製的聲景資料中,時常夾帶多種蛙類齊鳴之現象,這將導致電腦語音信號處理之複雜度提升,一般通常利用盲訊號分離(Blind Source Separation, BSS)的技術將混音進行分離,目前多通道的盲訊號分離已經有許多的研究文獻被提出,而獨立成分分析法(Independent Component Analysis, ICA)[1-2]是最被廣泛應用於盲訊號分離之研究,至於單通道訊號分離還是屬於發展當中的領域,目前有一些學者對於單通道訊號分離的問題,提出一些方法。
2001年時,Michael等人[3]利用獨立子空間分析(Independent Subspace Analysis, ISA)對單通道混合聲音進行訊號分離,首先將時域訊號轉換為時頻訊號(Spectrogram),以主成分分析法(Principal Component Analysis)與獨立成分分析法找出一組獨立基底向量(Independent Basis Vectors),並利用以獨立基底向量之交叉熵所組成的分區矩陣來對獨立基底向量進行相似度的分類,再將分類後的獨立基底向量進行逆轉換取得分離的訊號。
2003年Bonaroya等人[4]利用溫尼濾波器的想法,對於兩種樂器混在一起的音樂進行分離,在訓練階段找出各樂器的功率頻譜密度(Power Spectrum Density)經過特徵萃取得到特徵並存入資料庫,分離訊號時,將資料庫的特徵值取出進行特徵權重計算,直到特徵值與權重值的線性疊加結果接近混合訊號,此權重值即為答案,再利用特徵值與權重值進行分離的運算,但是此方法只適用於兩種訊號的混音進行分離,並且還必須事先知道樂器的種類才能進行分離,因此這方法對於未知的蛙類進行混音分離則不適合。
2004年Paris[5]將非負矩陣分解法(Non-negative Matrix Factorization, NMF)結合反摺積(Deconvolution)獲取頻譜上的時間變化,成功的從單通道混音訊號中擷取出鼓聲,此方
您可能关注的文档
- 新高中课程应用学习.ppt
- 无人飞行器制作材料项目技术要求.doc
- 方芸国家基本药物处方集.ppt
- 无线移动网络校园网方案的互补.doc
- 新问题亟待解决如业主大会成立难.ppt
- 日本东北藏王树冰银山温泉街玩雪5天.doc
- 日中文化交流中心中国员工规定5月改正版.doc
- 日台技术交流商谈会.doc
- 日照北部滨海地区发展规划国际咨询.doc
- 日本藤仓光纤熔接机FSM.doc
- 2025年广西中考地理二轮复习:专题四+人地协调观+课件.pptx
- 2025年广西中考地理二轮复习:专题三+综合思维+课件.pptx
- 2025年中考地理一轮教材梳理:第4讲+天气与气候.pptx
- 第5讲+世界的居民课件+2025年中考地理一轮教材梳理(商务星球版).pptx
- 冀教版一年级上册数学精品教学课件 第1单元 熟悉的数与加减法 1.1.6 认识1-9 第6课时 合与分.ppt
- 2025年中考一轮道德与法治复习课件:坚持宪法至上.pptx
- 2025年河北省中考一轮道德与法治复习课件:崇尚法治精神.pptx
- 八年级下册第二单元+理解权利义务+课件-2025年吉林省中考道德与法治一轮复习.pptx
- 精品解析:湖南省娄底市2019-2020学年八年级(上)期中考试物理试题(原卷版).doc
- 2025年中考地理一轮教材梳理:第10讲+中国的疆域与人口.pptx
最近下载
- 2025年新人教版数学一年级下册课件 第四单元 100以内的口算加、减法 2.口算减法 第3课时 解决问题.pptx
- 汉源__感动服务培训课程讲义.pptx
- 2025广西南宁市高三二模“坚守与发现:平凡中的非凡价值”审题立意及范文-备战2025年高考语文各地名校模考卷作文导写.docx
- 液压站讲义原理图.pptx
- 浙教版数学八年级下册第3章 数据分析初步 综合素质评价(含答案).docx VIP
- 2024年数控铣工(中级)技能鉴定考试题库资料-上(单选题汇总).pdf
- 闪电战及其应付之策.pdf VIP
- 2025高考化学一轮复习之物质结构与性质(解答大题).doc
- 2025年中央八项规定专题党课讲稿四篇.docx VIP
- 医院护工培训课件.ppt
文档评论(0)