网站大量收购独家精品文档,联系QQ:2885784924

005054跨媒体海量信息检索:搜索引擎未来之方向.pdf

005054跨媒体海量信息检索:搜索引擎未来之方向.pdf

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
005054跨媒体海量信息检索:搜索引擎未来之方向

展望 第 2卷 第 1 期 2006 年 1月 跨媒体海量信息检索: 搜索引擎未来之方向 庄越挺 潘云鹤 关键词:跨媒体 智能分析 浙江大学 计算机网络技术、多媒体技术以及数字传输、数字存储技术等的日益发展,使得每天由 新闻、影视、广告、监控等领域产生的大量图像、视频、音频等不同类型的多媒体信息可以 被数字化并加以保存。与此同时,各国数字图书馆的发展也产生了大量的多媒体数字信息。 所有这类数字资源的分布存储形成了一个庞大的网络多媒体数据库。如何有效地组织和管理 这些海量信息,使用户摆脱媒体类型的限制,可自由地通过网络快速浏览各种感兴趣的媒体 对象,并能跨媒体地进行信息检索,这是未来搜索引擎的发展方向。 不同类型的多媒体数据彼此混杂在一起,给当 引言 前的搜索引擎技术带来了前所未有的新挑战: 跨媒体的海量信息快速检索。 互联网技术的飞速发展,使人类迈入了 目前,主流的商业化搜索引擎主要基于 一个崭新的时代。它打破了人与人之间交流过 关键词。从搜索引擎技术而言,文本搜索引擎 程中的时空、文化、信仰、社会地位等因素的 技术已比较成熟,能进行元数据检索和全文检 限制,使信息的获取和传送可以在弹指一挥间 索,如Google、Yahoo和微软等公司的搜索引 完成。与此同时,每天由影视、广告、监控和 擎。为抢夺搜索引擎的市场份额,各搜索引擎 数字图书馆等领域产生的大量图像、音频和视 公司致力于新媒体类型的搜索引擎的研发,其 频等数据,形成了一个海量多媒体信息库。如 中包括音频搜索引擎、图像搜索引擎和视频 果没有一个合适的工具,要从中搜寻所需的信 搜索引擎等,且已向用户提供相关的初级服 息,其困难之大犹如大海捞针。 务。然而,这些搜索引擎技术只能处理单一媒 随着多媒体和数字存储技术的发展,目前 体类型的检索,无法自动支持语义层次上的检 文本与多媒体(指音频、图像、视频、数字几 索,无法兼容新兴的多种媒体类型的检索,如 何模型等非文本)数量之间的相对比例正在缩 Flash、三维图形、运动数据等。 小,即海量的多媒体信息正在逐步占据数据库 那么,是否可以跨越不同媒体之间存在的 的大部分空间[1]。一个专门的视频库(如录像 界限,使用户只需提交一种媒体类型的样本例 资料库)的数据规模可以轻易地达到1TB。而 子就能快速、准确地检索到想要的其他类型的 一个数字图书馆的数据规模则可以达到100TB 媒体数据呢?这需要新的针对跨媒体的有效检 以上。数字化存储价格的不断下降,使得TB级 索方式,这种方式体现的所谓“联想”、“触 的存储开始大众化。因此网络信息极为丰富, 类旁通”等能力,对人类来说是与生俱来的, 42 第 2 卷 第 1

您可能关注的文档

文档评论(0)

jgx3536 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6111134150000003

1亿VIP精品文档

相关文档