面向新闻视频检的音频分类算法.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
面向新闻视频检的音频分类算法.pdf

摘要 基于内容的音频信号分析处理在多媒体信息处理中占有很重要的地位,它要 求区分不同的音频类别并对其进行不同的处理,而这些在很大程度上都依赖于音 频自动分类技术的发展。音频分类技术是音频深度处理和音频结构化的基础,是 基于内容的音视频检索、辅助视频分析等应用的关键,在视频自动处理系统和其 他多媒体应用系统中有着广泛的应用。 本文在认真总结前人研究成果的基础上,深入考察了新闻音频信息的语义内 容,对层次化音频结构框架进行分析,并对不同层次的音频结构单元做出定义。 基于音频信息的内容和结构特点,确定了新闻音频中主要的音频类型:静音、纯 音乐、男主持人语音、女主持人语音、现场报道和男女主持人对话六类,并针对 音频特征分析与抽取、音频分类和基于DivergenceShapel}巨离的语音聚类等三个 方面的问题提出相应得解决方案。 首先从帧层次上和片段层次上深入研究了不同类别音频之间的特征,并针对 上述提出的六种音频类别,提出了静音比例、过零率标准偏差、中心频率标准偏 差、基音频率标准偏差和美尔倒频谱系数一阶差分美尔倒频谱系数五类片段特 征作为音频分类器的输入,通过实验验证了抽取的特征集在本文提出的分类器中 的分类性能。 其次,本文根据模式识别理论设计了音频分类的技术流程,并对其中所涉及 到的关键技术进行了探讨。着重对隐马尔科夫分类器进行了深入地研究,并根据 新闻音频类别的特点,提出一种基于规则和基于隐马尔科夫的音频分层分类算 法,通过实验分析了该算法的分类性能。 最后,为了对不同说话人的语义内容进行更深入地理解,本文在分类结果的 基础上,提出了基于DivergenceS11ape距离的聚类方法,尝试对主持人的语音进 行跟踪聚类,通过实验较好的聚类了不同主持人的语音。 关键词:新闻视频分析音频分类隐马尔科夫模型音频片段特征抽取聚类 ABSTRACT themost m oneof parts audio is important Content.basedsignalanalysis differentanddealwith discriminate multimedia needsto types processing,which all rolemitandISa classificationimportant differentmethods.Audio plays th锄in is in andaudio widelyapplied alldiocontent structuring.It wrorkof base analysis andothermultimedia retrieval applicationsystems· content.basedaudio/video theaudio the of research,thisdeeplyexplores Basedon developmentpast paper

文档评论(0)

chengben002424 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档