- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
基于文本的多媒体检索与基于内容的多媒体检索的比较
【摘要】:随着多媒体信息的不断增长,基于内容的多媒体信息检索技术成
为信息检索领域的一个热点。文章在对基于文本的多媒体信息检索和基于内容的
多媒体信息检索详细比较分析的基础上,探讨了多媒体信息检索的发展趋势。
【关键词】:多媒体检索;基于文本;基于内容
传统的基于文本的多媒体信息检索已经不能完全满足用户的要求,基于内容
的多媒体检索技术成为当前多媒体信息检索的研究热点。因此,对这两种多媒体
检索技术进行比较分析,为确定未来多媒体信息检索发展方向提供一定的借鉴。
1.传统基于文本的多媒体检索
1.1基于文本的多媒体检索的原理
由于早期信息检索处理的对象只有文本,所以基于文本的多媒体信息检索技
术便应运而生,并且仍然是当前最基本、最常用的一种多媒体信息检索方式。这
种基于文本的信息检索技术首先对多媒体进行人工分析,并抽取反映该多媒体物
理特性(拍摄方式、载体规格和文件大小等)和内容特性(责任者、代表多媒体
内容的关键词或主题词等)的文本信息,然后对这些文本信息按照学科领域进行
分类,或提取关键字进行文字著录或标引,建立类似于文本文献的标引著录数据
库,从而将对多媒体信息的检索转变成对文本信息的检索。在这种检索方式中,
通过数据库中的关键字段与多媒体建立链接,从而通过检索数据库中的关键文本
字段来获取多媒体信息。这种方式的检索具体可以采用四种途径进行检索:
a)利用文件扩展名和超文本标识。如图像文件的“.bmp”、“.gif”、“.tif”、
“.jpg”、视频文件的“.avi”、“.mov”、“.mpeg”、声音文件的“.wav”、“.mp3”、“.mid”
等。用这种方法只能保证检索到的结果是含有该格式的文件,而检索结果的内容
则可能由于文件名的不同而由差别。
b)将多媒体文件名和文字解说中带有的媒体信息作为关键词。
c)多媒体所在网页的标题或多媒体数据附近的文本。标题往往能反映网页
的内容,通过这些关键词也能得到检索结果。
d)人工选择或指定的某些多媒体信息内容的关键词。由人工搜集、分类和
标引有关多媒体资料,检索时按照既定的类别和关键词搜索所需多媒体信息。这
种检索质量和效率都比较高,但费用也较高。
1.2基于文本的多媒体检索的局限性
基于文本的多媒体信息的检索纯粹是以多媒体信息的外部特征作为检索入
口,无法表达和揭示多媒体信息的实质内容和语义信息。归纳起来,基于文本的
多媒体信息检索有以下不足:
a)在使用全文检索技术对多媒体信息进行检索之前,先要对搜集到的所有
媒体信息进行人工关键字标引,人工注释要求大量的人力,尤其是大型多媒体信
息库;
b)多媒体信息数据量大,人工注释难以涵盖蕴藏在多媒体数据中所有的内
容信息;
c)多媒体信息制作者的文化背景不同、专业知识迥异,这样使得取自其标
题的文本信息与多媒体信息的真实内容不符;
d)人工注释难以避免对多媒体信息内容描述的主观性;
e)对于视频和音频等时基媒体的处理,手工处理是完全不可行的,必须用
计算机进行实时的内容分析。
2.基于内容的多媒体检索的原理与特点
2.1基于内容的多媒体检索的原理
基于内容的多媒体信息检索是根据媒体和媒体对象的内容及上下文联系在
大规模多媒体数据库中进行检索,主要是利用多媒体对象的语义、视觉和听觉特
征来进行检索,如图像中的颜色、纹理、形状,视频中的镜头、场景、运动,声
音中的音调、响度、音色等。基于内容的检索是多媒体研究中的新兴热点,它突
破了传统的基于文本检索技术的局限。在组织多媒体信息时,组织者根据媒体的
内容特征进行分析,建立基于内容的特征库,并与实际多媒体数据联系起来,这
个过程是由系统事先完成的,即在交给用户使用之前,系统已经建立了媒体库和
特征库。当用户检索时,系统一方面接受用户规定的图像、视频和音频等内容特
征信息(即用户的检索提问),另一方面接受特征信息索引库中的特征信息,然后
进行两者之间的匹配,以找出符合用户需求的多媒体信息。
以上检索过程是完全以计算机为中心,因此使得一些检索结果不能完全满足
用户的要求,即检索结果中有一些计算机认为是相似的,而人却认为是不相似的,
因为计算机视觉技术、智能化水平与人比起来,还相差很远。多媒体信息检索技
术的最终用户是人,为了解决这些问题,应该允许用户从检索结果中挑选出一些
自己比较满意或不满意的媒体信息,或
文档评论(0)