1研究原因.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
1研究原因

國立台灣大學電信工程學研究所碩士論文 音訊標準格式轉換與音樂搜尋系統-part1 作者:葉芳均 1:研究原因 這篇paper提到音訊標準轉換格式以及內涵式音樂搜尋系統兩個主題,因為DSP這門課就是關於語音的辨識和處理,而我發現這篇paper,即是在探討一些關於語音方面的分析處理,和上課的內容有很大程度相關,所以就以這篇論文當作final project。 2:緒論 這篇paper一開始談到Sampling Rate Conversion(SRC)在discrete time signal的處理,簡單來說,就是將信號從一個取樣頻率換成另一個頻率,而做SRC的原因是因為從標準音樂格式的觀點來看,從工程師知道了CD的離散時間語音訊號的儲存原理之後,CD的儲存格式便幾乎取代了以往的類比儲存方式,之後隨著數位儲存技術的成長,如雨後春筍般,冒出了許多標準語音格式和CD競爭,這些新的標準格式大致有以下特性: 更有彈性的紀錄格式,使的跨平台使用得以實現。 提供更大容量和更快速且正確的搜尋速率。 比原本的標準格式提供了更高的取樣頻率。 但是因為這些格式通常都使用不同的取樣頻率,所以想要從一個格式轉換成另1種格式時,就得要做SRC。 在這篇論文裡面,作者還介紹了一個比較有效率的方法。這個方法是用generalized scaling algorithm來做取樣頻率的轉換,就由這個演算法,我們就能將取樣頻率依照設定的比例來做調整。此外作者還提出一個快速的algorithm已達成real-time的轉換,並且可以修改成任意的放大比例,而不需如同傳統的multi-rate轉換,得要先將頻率提高到一個很高的取樣頻率。 這篇paper大致可分成以下幾段內容: 首先會提到一些數位語音格式和關於SRC的背景知識跟使用,並且介紹了有關於這些標準語音格式的一些性質。 接著是關於generalized scaling algorithm,包含傳統的演算法,還有filtering的window effect,以及一個取樣方法-Sample and Hold approximation和一些實驗結果。之後會拿專業軟體的SRC和他自己的SRC演算法比,能發現performance跟那些專業軟體差不了多少,但執行速度更快。 最後,是作者關於SRC的結論,以及未來SRC可以努力改善的方向。 3:Paper正文: Section1:Related Work in SRC 隨著個人電腦的功能越來越強大,人們會想要有比以前更高的語音品質,因此許多數位語音格式錄錄續續的產生,因為硬體使用上,可能會有一些限制,所以使用者會想要在兩種音樂格式上作轉換,這就是為什麼SRC會變成一個數位訊號處理的重要課題,在這個章節中,作者先介紹一些最近的一些數位音樂格式和一些特殊目的的SRC軟硬體。 1.1 Digit Audio Formats Overview (1) CD(Compact Disc): CD是一個由Sony和Philips在1982年時所出版的儲存媒介物,CD具有65536的離散等級(discrete level),而且每秒能夠取樣44100次,而數位訊號就是儲存在螺旋的軌道上。在一個標準的74分鐘CD中,有22188的軌道跨過園盤的半徑,總長度約是5.7公里,軌道的讀取是偵測CD凹凸不平的表面,以1.2m/s的速度讀取。為什麼取樣速度要選44100HZ呢?第一個理由就是人類的語音能力差不多是從20HZ到20KHZ,根據取樣定理(Sample Theorem),我們只需要40KHZ就能夠完整地保存訊號了,而特別選44100HZ就是為了要延續語音格式的傳統,一秒30個frame,一個frame 490lines,和1 line有3個訊號,所以大概一秒大概會有個樣本,而CD的優點就是在於它的便利性和比較好的品質,最後到目前為止,它也取代了傳統的磁帶成為目前最流行的語音格式。 (2)DAT Digital Audio tape(DAT)是由Sony和HP在1987年所發明的,它能藉著懸旋掃描紀將所紀錄的數據轉變成數位訊號並儲存起來,比起CD,為了要能提供更高畫質,DAT的取樣頻率是48000HZ,它的容量是2GB~40GB,而且找數據所需要用來掃描所要的時間會小於1分鐘,因為DAT的高容量和快速搜尋,近幾年它也被運用在數據儲存上。 (3)DVD Audio DVD Audio是在1999年發展出來的,它是有著和DVD Video相同容量的語音格式的DVD。DVD Audio支援多重數位訊號格式,包括16bits,20bits,24bits而最多到6個channel,對2個channel、24bits訊號而言,取樣頻率約為192KHZ,而對6個channel、24bits訊號

文档评论(0)

2752433145 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档