音频检索方法的研究.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
维普资讯 长江大 学学报 (自然科 学版) 2008年 6月 第 5卷 第 2期:理工 JournalofYangtzeUniversity(NatSciEdit) Jun.2008。Vo1.5No.2:Sci Eng ·89 · 音频检索方法的研究 钟宝荣 ,吴春辉 (长江大学计算机科学学院,湖北荆州434023) 杜 红 (长江大学电子信息学院,湖北荆州434023) [摘要]音频检索技术是多媒体检索技术 中的一个重要组成部分,但在多媒体流 中基于 内容的音频检索工 作做得很少 。将分析音频信号的特征,通过对基于 内容的检索技术 的讨论 ,提供一种通过声学特征的相 似 性来检 索音频文件 的方法。在检 索过程 中,把 不 同的音 频文件 组合 成 音频 文件 库,呆 用模糊 统计 的方 法 ,对相似性进行分析,达到对不 同内容的音频检索。 [关键词]音频检索;CBR;模糊统计;音频 ;相似性 [中图分类号]TP391.4 [文献标识码]A [文章编号]1673—1409 (2008)02一N089—03 随着现代信息技术和存储技术的快速发展 以及 www 的迅速蔓延 ,使得人们在 日常生活中能更加 频繁地 、方便地接触到数字媒体 ,多媒体数据也 已经成为互联 网信息高速公路上所传送数据 的主要部 分。在多媒体系统中,语音和音乐是不可少的。声音是人们最熟悉最习惯的传递信息方式 ,声音媒体是 除视觉媒体外最重要 的媒体 ,它 占有总信息量 的2o 左右 ,其中语音和音乐又是最常见 的声音媒体形 式 ,人们在 日常生活 中所面临的问题不再是缺少多媒体 内容 ,而是如何在多媒体世界中找到 自己所需要 的信息 。为了能够方便人们寻找多媒体数据 ,近年来 ,国内外在多媒体数据库技术的研究 中出现 了一个 新热点,即基于内容的检索技术 CBR (ContentBasedRetrieva1)。该技术是继基于内容的图像检索之后 发展起来的一个新兴研究方向,它通过音频特征分析 ,对不 同音频数据赋以不同的语义 ,使具有相同语 义的音频在听觉上保持相似 。 1 音频检索 1.1 音频检索的处理过程 通过对语音或音乐这样 的音频信号进行特 征表示l1],不断通过特征 的相似 匹配来修正特 征 的表示形式 ,以期得 到音频信息 的检 索结 果_l2],其处理过程如 图1。 基于 内容的查询和检索是逐步求精的过程 , 存在一个特征调整和重新匹配 的过程 :①用户 提交查询 ,用户利用系统提供 的查询方式形成 查询条件 ;②将查询特征与数据库中的特征按 照一定的匹配算法进行匹配 ;③满足一定相似 性的一组候选结果按相似度大小排 列返 回给用 户 ;④对 系统返 回的一组初始特征的查询结果 , 用户可 以通过遍历 (浏览)挑选 出满 意的结果 , 图 1 基于 内容的音频检索过程 也可以从候选结果 中选择一个示例进行特征调 整,形成一个新 的查询 ,这个过程可以多次进行 ,直到用户对查询结果满意。 [收稿 日期]2008—02—23 [基金项 目]湖北省教育厅优秀 中青年科技创新 团队计划项目 (鄂教科 2004—7—4)。 [作者简介]钟宝荣 (1963一),男,1986年大学毕业 ,硕士,副教授,现主要从事数据库、网络与通信方面的研究工作。 维普资讯 长江大学学报 (自然科学版) 2008年 6月 1.2 特征提取 基于内容的音频检索技术主要分为 3大部分:音频内容 的获取 、音频内容的描述 (音频特征提取) 和特征相似度匹配。音频内容描述即音频特征提取 ]是整个基于 内容的音频检索技术的核心技术。音频 内容描述是在音频内容获取的基础之上进行的,同时是进一步进行音频特征相似度匹配的必要前提。特 征提取指的是寻找原始音频信号的表达形式 ,提取能代表原始信号的数据 。要抽取特征和属性 ,通常要

文档评论(0)

jingpinwedang + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档