- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
维普资讯
长江大 学学报 (自然科 学版) 2008年 6月 第 5卷 第 2期:理工
JournalofYangtzeUniversity(NatSciEdit) Jun.2008。Vo1.5No.2:Sci Eng ·89 ·
音频检索方法的研究
钟宝荣 ,吴春辉 (长江大学计算机科学学院,湖北荆州434023)
杜 红 (长江大学电子信息学院,湖北荆州434023)
[摘要]音频检索技术是多媒体检索技术 中的一个重要组成部分,但在多媒体流 中基于 内容的音频检索工
作做得很少 。将分析音频信号的特征,通过对基于 内容的检索技术 的讨论 ,提供一种通过声学特征的相
似 性来检 索音频文件 的方法。在检 索过程 中,把 不 同的音 频文件 组合 成 音频 文件 库,呆 用模糊 统计 的方
法 ,对相似性进行分析,达到对不 同内容的音频检索。
[关键词]音频检索;CBR;模糊统计;音频 ;相似性
[中图分类号]TP391.4 [文献标识码]A [文章编号]1673—1409 (2008)02一N089—03
随着现代信息技术和存储技术的快速发展 以及 www 的迅速蔓延 ,使得人们在 日常生活中能更加
频繁地 、方便地接触到数字媒体 ,多媒体数据也 已经成为互联 网信息高速公路上所传送数据 的主要部
分。在多媒体系统中,语音和音乐是不可少的。声音是人们最熟悉最习惯的传递信息方式 ,声音媒体是
除视觉媒体外最重要 的媒体 ,它 占有总信息量 的2o 左右 ,其中语音和音乐又是最常见 的声音媒体形
式 ,人们在 日常生活 中所面临的问题不再是缺少多媒体 内容 ,而是如何在多媒体世界中找到 自己所需要
的信息 。为了能够方便人们寻找多媒体数据 ,近年来 ,国内外在多媒体数据库技术的研究 中出现 了一个
新热点,即基于内容的检索技术 CBR (ContentBasedRetrieva1)。该技术是继基于内容的图像检索之后
发展起来的一个新兴研究方向,它通过音频特征分析 ,对不 同音频数据赋以不同的语义 ,使具有相同语
义的音频在听觉上保持相似 。
1 音频检索
1.1 音频检索的处理过程
通过对语音或音乐这样 的音频信号进行特
征表示l1],不断通过特征 的相似 匹配来修正特
征 的表示形式 ,以期得 到音频信息 的检 索结
果_l2],其处理过程如 图1。
基于 内容的查询和检索是逐步求精的过程 ,
存在一个特征调整和重新匹配 的过程 :①用户
提交查询 ,用户利用系统提供 的查询方式形成
查询条件 ;②将查询特征与数据库中的特征按
照一定的匹配算法进行匹配 ;③满足一定相似
性的一组候选结果按相似度大小排 列返 回给用
户 ;④对 系统返 回的一组初始特征的查询结果 ,
用户可 以通过遍历 (浏览)挑选 出满 意的结果 ,
图 1 基于 内容的音频检索过程
也可以从候选结果 中选择一个示例进行特征调
整,形成一个新 的查询 ,这个过程可以多次进行 ,直到用户对查询结果满意。
[收稿 日期]2008—02—23
[基金项 目]湖北省教育厅优秀 中青年科技创新 团队计划项目 (鄂教科 2004—7—4)。
[作者简介]钟宝荣 (1963一),男,1986年大学毕业 ,硕士,副教授,现主要从事数据库、网络与通信方面的研究工作。
维普资讯
长江大学学报 (自然科学版) 2008年 6月
1.2 特征提取
基于内容的音频检索技术主要分为 3大部分:音频内容 的获取 、音频内容的描述 (音频特征提取)
和特征相似度匹配。音频内容描述即音频特征提取 ]是整个基于 内容的音频检索技术的核心技术。音频
内容描述是在音频内容获取的基础之上进行的,同时是进一步进行音频特征相似度匹配的必要前提。特
征提取指的是寻找原始音频信号的表达形式 ,提取能代表原始信号的数据 。要抽取特征和属性 ,通常要
文档评论(0)