基于内容多媒体文件搜索技术.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于内容多媒体文件搜索技术

基于内容多媒体文件搜索技术   摘 要 数字多媒体文件目前主要包含文本、图像、音频和视频四种主要格式。在对多媒体文件进行搜索时,因为互联网上的图像和音、视频文件的传播缺乏统一规范,同一内容会采用不同的主题词来描述,且其包含的内容丰富,数据量较大,因而传统的主题词方式不能满足图像和音视频文件的关键词搜索需求。基于内容的搜索引擎是目前搜索引擎技术发展的一个重要课题。   关键词 数字多媒体 基于内容 音频文件 视频文件 关键帧   中图分类号: TP37 文献标识码:A   随着互联网的飞速发展,信息出现爆炸式增长,搜索引擎已经成为了用户上网查询信息不可缺少的应用服务。搜索引擎所检索的信息覆盖面大,相关度高,在用户需要进行范围广泛的查询。但是随着当今网络上多媒体文件数据的日渐增多,传统的基于文本的搜索引擎越来越难以满足用户的需要。特别对于视频的查询,关键字的标注往往难以准确描述视频表示的含义,并且对视频进行标注需要投入大量的人力,于是基于内容的搜索技术应运而生,迅速成为研究热点。   数字多媒体文件目前主要包含文本、图像、音频和视频四种主要格式。广告、新闻等传媒文件在互联网上传播速度快、传播范围广、受众人数多,依靠人工统计的方式难以实现对其传播效果的分析。相对于这些传统媒体,基于互联网传播的多媒体文件能够得到媒体受众更详细的信息,包括性别、年龄、收入、学历、职业等人口统计学数据,还可以得到受众行为数据包括访问次数、访问时间、访问频次、停留时间等。网页多媒体文件获取的用户行为信息比传统媒体如报纸、广播、电视等更为丰富,用户还可以主动获取自己需要的信息并作出反馈,这些受众信息及数据是用户访问过程中,系统自动记录的,相较于传统媒体的数据统计,更为精确和可靠。基于以上于互联网的多媒体传播效果的特点,我们在越来越多的使用数字多媒体文件,它的传播效果具有具有广泛性、准确性、及时性。   采用基于内容的方式对图像和音、视频文件进行搜集,其首要问题就是找到能够有效表示图像和音、视频文件内容的特征,因而,图像和音、视频文件的特征提取技术是现代传播效果分析的主要研究内容之一。用户在搜索某一单一文件或者某类型文件的时候,往往只能使用关键词作为搜索机制。目前基于文本搜索引擎技术发展已经十分成熟,而这类搜索引擎的准确度除了依赖于搜索引擎系统的网页信息存储量和词汇切割的准确度以外,用户所搜寻的目标文件也是影响其准确度的一个重要因素,如果用户着重于搜索文本形式的文件,此类搜索引擎的准确率已经很高。但是,传统的基于文本搜索引擎只能分析网页中的文本内容,无法满足用户对互联网上越来越多的多媒体文件的搜索查询需求。如果用户希望搜索的是图片、音频或者视频类无法在网页中只用文本就能精确描述其内容的文件,则其准确率就会受到很大影响.因此基于内容的搜索引擎是目前搜索技术发展的一个重要课题互联网的数字媒体文件搜索中文本搜索的技术是最为成熟和广泛应用的;近几年,随着计算机技术的发展,基于内容的图像、音频、视频搜索技术也逐渐成熟。基于内容的搜索技术尝试直接分析图片、视频及音频等媒体文件,将它们根据特征分类。用户可以通过提交一幅图片或者一段音频、视频资料来表达自己的搜索意图(比如用户希望能够搜索到含有类似图片的网站),搜索引擎系统通过对用户提交的多媒体文件进行分析、比对,输出检索到的信息.我们利用自然语言处理技术、基于内容的音、视频分析和检索技术,实现对文本、图像、音频、视频格式媒体文件的多模态搜集、分析,为更专业化的多媒体文件搜索提供完备和准确的数据。   要对多媒体文件进行搜索工作,主要完成数字媒体文件搜集工作。搜集文件首先要完成对网页的分析工作,以对可能包含待评估数字媒体文件的网页进行优先爬行,实现在最短的时间内,最大限度的爬行最相关的网页,对无关的区域不予访问,以减少对网络信息的访问流量和文件的下载量。然后基于数字多媒体文件的相似度的研究结果,对抓取的网页进行分析,只保留与待搜索文件足够相似的网页,这样可以得到完备、准确的搜索数据,以保证搜索的有效性和实时性。因而对互联网的数字媒体文件进行搜集是进行文件搜索的第一项工作。   多媒体文件中:文本文件是词汇的集合,可以通过词汇相似度来比较文本文件的相似性;图像文件是由图像和描述信息共同组成,可以结合词汇和图像相似度来共同计算图像文件的相似度;音频文件是由声音和描述信息共同组成,我们用词汇和音频相似度来共同度量其相似程度;视频文件包含的信息最为丰富,其是图像序列集合,关键帧是其中的代表性图像。除此外还具有文本描述信息和音频信息,在提取关键帧的基础上,研究融合词汇、图像和音频多种方式的相似性度量方法。对不同类型的多媒体文件,我们采取的内容特征提取的方式不一样。   文本内容特征常用向量空间模型表示,向量空间模型把文档看成是由一组词

文档评论(0)

erterye + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档