是另一个音讯里面很重要的特徵,直觉地说,音高代表声.docVIP

是另一个音讯里面很重要的特徵,直觉地说,音高代表声.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
是另一个音讯里面很重要的特徵,直觉地说,音高代表声

「音高」(Pitch)是另一個音訊裡面很重要的特徵,直覺地說,音高代表聲音頻率的高低,而此頻率指的是「基本頻率」(Fundamental Frequency),也就是「基本週期」(Fundamental Period)的倒數。 若直接觀察音訊的波形,只要聲音穩定,我們並不難直接看到基本週期的存在,以一個 3 秒的音叉聲音來說,我們可以取一個 256 點的音框,將此音框畫出來後,就可以很明顯地看到基本週期,請見下列範例: 範例 1輸入: close all waveFile=soundFork.wav; [y, fs, nbits]=wavread(waveFile); index1=11000; frameSize=226; index2=index1+frameSize-1; segment=y(index1:index2); subplot(2,1,1); plot(y); grid on title(waveFile); set(gca, xlim, [0, length(y)]); limit=axis; line(index1*[1 1], limit(3:4), color, r); line(index2*[1 1], limit(3:4), color, r); subplot(2,1,2); plot(segment, .-); set(gca, xlim, [1, index2-index1+1]); point=[7, 189]; line(point, segment(point), marker, o, color, red); periodCount=5; fp=((point(2)-point(1))/periodCount)/fs; ff=fs/((point(2)-point(1))/periodCount); pitch=69+12*log2(ff/440); fprintf(Fundamental period = %g second\n, fp); fprintf(Fundamental frequency = %g Hertz\n, ff); fprintf(Pitch = %g semitone\n, pitch); 輸出訊息: Fundamental period = 0.002275 second Fundamental frequency = 439.56 Hertz Pitch = 68.9827 semitone 輸出圖形: 在上述範例中,上圖紅線的位置代表音框的位置,下圖即是 256 點的音框,其中紅線部分包含了 5 個基本週期,總共佔掉了 182 單位點,因此對應的基本頻率是 fs/(182/5) = 16000/(182/5) = 439.56 Hz,相當於 68.9827 半音(Semitone),其中由基本頻率至半音的轉換公式如下: semitone = 69 + 12*log2(frequency/440) 換句話說,當基本頻率是 440 Hz 時,對應到的半音差是 69,這就是鋼琴的「中央 La」或是「A4」,請見下圖。 提示 一般音叉的震動頻率非常接近 440 Hz,因此我們常用音叉來校正鋼琴的音準。 上z公式所轉換出來的半音差,也是 MIDI 音樂檔案所用的標準。從上述公式也可以看出: 每個全音階包含 12 個半音(七個白鍵和五個黑鍵)。 每向上相隔一個全音階,頻率會變成兩倍。例如,中央 la 是 440 Hz(69 Semitones),向上平移一個全音階之後,頻率就變成 880 Hz(81 Semitones)。 人耳對音高的「線性感覺」是隨著基本頻率的對數值成正比。 音叉的聲音非常乾淨,整個波形非常接近弦波,所以基本週期顯而易見。若以我的聲音「清華大學資訊系」來說,我們可以將「華」的部分放大,也可以明顯地看到基本週期,請見下列範例: 範例 2輸入: close all waveFile=清華大學資訊系.wav; [y, fs, nbits]=wavread(waveFile); index1=7450; frameSize=512; index2=index1+frameSize-1; segment=y(index1:index2); subplot(2,1,1); plot(y); grid on title(waveFile); set(gca, xlim, [0, length(y)]); limit=axis; line(index1*[1 1], limit(3:4), color, r); line(index2*[1 1], limit(3:4), color, r); subplot(2,1,2); p

文档评论(0)

wyw118 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档