视觉系统分布式计算结构模型的构建与实现.pdfVIP

视觉系统分布式计算结构模型的构建与实现.pdf

  1. 1、本文档共11页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
视觉系统分布式计算结构模型的构建与实现

视觉系统分布式计算结构模型的构建与实现 王国建 1 陶霖密 1 叶喜勇 1 邸慧军 1 1 清华大学 计算机科学与技术系, 100084 摘 要:计算模式正在从桌面计算转向以人为中心的计算,在这种新的计算模式下,计算系统 在理解人的意图的基础上为人提供主动服务,从而形成基于分布式视觉计算的隐含交互系统。 通过设计一种能灵活配置和管理系统计算资源的软件架构,将有助于解决隐式交互中始终面临 的无限的计算需求和有限的计算资源之间的矛盾。本文提出以应用为中心的服务共享模型,将 目标致力于向不同的应用提供各种透明的服务,尤其是视觉计算服务,构建灵活配置的分布式 视觉系统,用于实现隐含人机交互。基于该模型实现的分布式视觉信息系统平台的基本性能测 试验证了上述结构模型的可行性。 关键词:多媒体技术;分布式计算;服务共享 1.引言 在将视觉系统应用于以人为中心的计算这种新计算模式时,计算系统必须通过理解人 的意图在合适的时间为用户提供合适的主动服务,以构成隐含交互。对基于视觉的多媒体 系统来说,系统不应限制用户在场景里自由移动,而是和用户在任何地点都能无缝地按照 用户的习惯进行交互。 这样由于单摄像机视域的限制,分布式的多摄像机系统就成为必然 要求。为了克服单摄像机视域的限制,近年来随着多媒体技术的发展和数字视频设备的普 及,支持分布式计算的视觉系统正在受到更多关注[1],由于理解意图必须结合上下文环境, 这使得计算系统担负了更多更复杂的计算任务,单一的集中式计算已经不能满足这种要求, 以前提出的很多视觉系统,其视频内容分析的算法由于采用集中式计算限制了其在系统中 的融合,也制约了基于视觉处理的多媒体技术向以人为中心的新计算模式发展[2]。为了建 立更富有伸缩性的系统,具有可扩展处理能力的分布式视觉计算系统也成为必然要求。 在将分布式计算的结构用于以人为中心计算的视觉系统时,通用的方式比如最近流行 的云计算由于并未根本解决服务共享问题及安全性问题[3],尤其对于多路视频数据的压缩、 传输及解压缩等大数据量数据的处理及数据处理同步等分布式视觉系统中的关键问题仍需 用户自己解决,因此并不能直接应用。目前为止已经提出了许多分布式视觉信息处理系统, 这些系统从其计算的集中程度划分主要有 3 种处理方式:1)单一式系统。对来自多个摄像 机的所有原始数据(视频)的处理均在一个程序(进程)内完成,不存在各模块自主式的 处理,这种方式下分布式计算的程度最低[4][5]。2)根据担负的任务进行层次划分。在这种 处理方式下,系统包含了很多处理节点,每一个处理节点(单元)被分配一个专用的计算 机系统,同时各节点的处理结果在更高层次的基础上又以一种相对集中的方式被收集和处 理,这样层层推进组成一个分布式系统,当前的大部分分布式系统都是采取这种方式 资助项目:中国自然科学基金 联系作者:王国建,E-mail:wgjxx001@ [6][7][8][9]。3)非中心化平等计算。将一个系统在逻辑上区分为相互平等的多计算单元的组 合,各计算单元能够相互通信以融合处理结果得到进一步的结果。如基于多代理的分布式 系统[10][2]。这种方式具有最灵活的结构,各计算单元间的通信协议较为复杂,对于视觉系 统而言只能是在提供通用的视觉计算这一层次上运用这种分布式计算方式,至于更具体的 应用仍然要在此基础上增加相对集中式的计算处理。 用于以人为中心计算的分布式视觉系统要进行包括视频、音频以及各种传感器数据的 多媒体数据等自底向上的信号及信息处理,更重要的是要参与隐式人机交互,需要能理解 人们在日常生活和工作中通过语音、 图像等多模态的方式进行的交互,这些物理空间中的 各种操作或活动从信息空间的角度来看都可表示为多模态数据的“时间-空间流” [11]。这 种多任务大数据量的实时处理对其分布式计算结构提出了更高的要求,本篇论文阐述的目 标就是基于前述第 3 种分布式计算方式,建立一种更加灵活的软件架构,对视觉系统的更 高层应用和协作处理提供平台支持。 在分析通用的分布式视觉系统信息处理模型的基础上,我们提出一种以应用为中心的 服务共享模型 A-SSM(Application-center Service Share Model),主要用于构建分布式视觉 系统的通用服务架构。基于这个服务共享模型,我们通过构建三个简明的抽象要素:queue, queue reader and queue writer 实现了一个视觉信息系统平台原型系统,在这里我们把视觉处 理的行为及其它计算抽象成

文档评论(0)

***** + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档