基于内容的音频信息检索[参考].pptVIP

  • 4
  • 0
  • 约1.27万字
  • 约 58页
  • 2016-12-03 发布于浙江
  • 举报
* Wu Gangshan: Modern Information Retrieval * (3) 音频分割的好处 音频是时基线性媒体。现在我们看到的典型音频播放接口是与磁带录音机相似的界面,具有停止、暂停、播放、快进、倒带等按钮。 为了不丢失其中的重要东西,必须从头到尾听一遍声音文件,这样要花费很多时间,即使使用“快进”,也容易丢失重要的片断,不能满足信息技术的要求。 因此,在分割的基础上,就可以结构化表示音频的内容,建立超越常规的顺序浏览界面和基于内容的音频浏览接口。 * Wu Gangshan: Modern Information Retrieval * 补充:Audio Features Features derived in the time domain: ~average energy ~zero crossing rate (ZCR): It indicates the freq of signal amplitude sign change. ~silence ratio: Thresholding may be tricky. Features derived in the freq domain ~sound spectrum【频谱】 ~bandwidth 【带宽】 : Music usually has a hig

文档评论(0)

1亿VIP精品文档

相关文档