信息媒体数字视频图书馆(idvl)项目的设计与实现.docxVIP

下载本文档

0
0
约5.09千字
约 5页
2023-07-24 发布于广东
举报
版权申诉

信息媒体数字视频图书馆(idvl)项目的设计与实现.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

信息媒体数字视频图书馆(idvl)项目的设计与实现 1 关于创物体的网站开发信息媒体信息服务图书馆（idvl）创建于1994年。这是美国数字图书馆的第一个计划，也是当时美国唯一的研究视频信息项目。Informedia项目的参与机构以卡内基·梅隆大学为主,合作机构包括Microsoft公司、数字设备公司、贝尔大西洋网络服务公司、QED广播公司、英格兰米尔顿《基尼斯的开放大学、温彻斯特Thurston中学和费尔法克斯县的公立学校等,目标是建立一个联机交互的在线数字视频图书馆系统,使用户能够通过网络查询、检索和获取科学与数学方面的视听资料。Informedia项目的网址为/,主页如图1所示。 Informedia项目的开发经历了两个阶段:1994—1998年为第一阶段,称为Informedia-Ⅰ;1999年以后为第二阶段,称为Informedia-Ⅱ。Informedia-I是DLI-Ⅰ的一个组成部分,接收美国国家科学基金会(NSF)、美国国防部高级研究计划署(DARPA)和美国宇航局(NASA) 480万美元的资助,目标是赋予音频、视频在查询、检索、分类和摘要各方面与文字文献相同的功能。Informedia-Ⅱ在DLI-Ⅱ中继续得到400万美元资助,除DLI-Ⅰ的三个赞助单位(NSF、DARPA和NASA)外,赞助单位还增加了美国医学图书馆、美国国会图书馆、美国人文学科基金会、美国联邦调查局,目标是继续在视频信息处理方面进行探索,增强视频信息提取的速度和准确性,加强信息的显示能力,有效处理大量视频文献,提高系统的访问效率。 2 资源组织 2.1 家庭暴力录像及教育录像制品 Informedia系统提供对现在和过去的电视、广播新闻、纪录片和广播的全文查询及检索。自1994年开始,卡内基·梅隆大学的信息媒体项目对来自CNN的新闻视频信息、英国开放大学、QED通信机构(QED Communications)、发现频道(the Discovery Channel)以及美国许多政府机构(如美国宇航局、国家公园服务处National Park Service、美国地质调查局U.S.Geological Survey等)的纪录片及教育录像制品进行数字化。Informedia项目的开始阶段,该系统通过网络向用户提供1000小时的录像资料;2000年,视频数字图书馆己拥有2000小时5000个片段的视频信息,并且继续以每周10小时的速度增长;到2002年,Informedia系统拥有2TB的每日新闻和公众电视、政府机构的纪录片,视频信息已经增加到大约3000小时。 2.2 文本与视频信息的融合 Informedia系统以全自动化的方式对每天的内容进行捕获和信息抽取,并把它们存储在在线档案中;利用广播电视节目中的脚本信息构造文本索引,通过语音识别器将伴音转换为文本;使用视频分析模块提取人脸特征、叠加在屏幕上的文本和视频镜头边界等,然后将这些信息全部绑定形成最终的索引结构,支持快速多媒体相似检索;同时,允许根据声道、封闭字幕和屏幕上的文本对个别视频段落进行快速检索,支持任意说出的或文字输入的主题词提问;它还能够对相似的脸和图像进行匹配。该系统能将文本和视频信息融合起来,尤其是把底层和中层的视频特征,包括镜头边界、人脸等,与语音识别出来的伴随文本和视频的字符识别(Optical Character Recognition,简称OCR)出来的镜头标题和字幕集成起来使用。为了提高视频信息的检索效果,Informedia视频数字图书馆对录像制品进行自动编码处理,并从中提取有关信息生成地点附注。在该检索界面中,可以将特定事件与其发生地建立关联,实现从事件、时间到地点的论题检索,或从地点入手检索视频信息的空间查询方法。在信息媒体图书馆视频信息中,描述性的文本信息是地点附注(Geographic Reference)的主要来源。通过对视频文件中的文本元数据进行信息源处理,就能产生地理编码。Informedia图书馆项目所使用地名词典是从环境系统研究所(Environmental Systems Research Institute,ESRI)的世界地名词典中派生出来的数据子集。该地名数据子集包括全世界约300个国家、州、行政实体以及17000个主要城市。经过处理,最后将文本元数据和视频的播放时间联系起来,并根据与之对应的地理编码簿标出该地的经度和纬度。同时,对文本式的元数据进行语法分析,从中抽取包含地名的句子。通过对来源元数据的上下文分析,系统能够辨别它们的不同含义,确定它是人名还是地名,并按专有名词归类,从而更精确地表示其地理方位。 3 技术属性 3.1 信息发布模块卡内基·梅隆大学Informedia数字视频图书馆的主页设计清晰实用(图1),使用户能够