基于图语法视觉知识表达与标注图像数据库.docVIP

下载本文档

12
0
约1.32万字
约 24页
2018-08-29 发布于福建
举报
版权申诉

基于图语法视觉知识表达与标注图像数据库.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于图语法视觉知识表达与标注图像数据库

基于图语法视觉知识表达与标注图像数据库　　 (1.华中科技大学图像识别与人工智能研究所，武汉430074； 2.莲花山计算机视觉和信息科学研究院，湖北?? 　　鄂州 436000) 　　?? 　　摘要：　　莲花山数据集采用与或图作为视觉知识模型，实现对客观世界中视觉模式的多层次表达，从而将多种标注任务统一到图像语法模型框架下。配套数据库通过两层模型分别管理视觉模型与标注数据，提供了灵活方便的数据导入、管理、查阅、输出功能，这是其他数据集所不具备的。最后给出基于该数据集标注结果的内容检索实验，该算法加入到标注工具中，作为一种自动功能用于辅助加速人工标注过程。　　?す丶?词：图像语法；视觉模型；人工标注；图像数据集；计算机视觉　　?ぶ型挤掷嗪牛?TP391.41 文献标志码：　　文章编号：1001-?B3695(2009)02-?B0747-?B05 　　?? 　　Visual knowledge representation based on image grammar and annotated database 　　?? 　　PENG Shao-wu1,2,LIU Le-yuan1,2,YANG Xiong1,2,SANG Nong1 　　??(1. Institute of Pattern Recognition Artificial Intelligence, Huazhong University of Science Technology, Wuhan 430074, China; 2. Lotus Hill Institute for Computer Vision Information Science, Ezhou Hubei 436000, China) 　　?? 　　Abstract:LHI image dataset is a most various multi-task annotated dataset. It uses and-or graph as visual knowledge model to represent the visual pattern in a hierarchical way. By this means, this paper integrated multi-task human annotation into a unified framework. The corresponding database used a two-tier model to manage visual model and annotated data respectively, while offering flexible functions of data import, management, browse and export, which was not seen in other dataset. A content-based retrieval experiment shows that annotated image works well on this algorithm, and this function is added into the label tool to assist the human label. 　　??Key words：image grammar;visual model;human annotated;image dataset;computer vision 　　?お? 　　0 引言?? 　　在计算机视觉领域，建设能适应多种需求的大型人工标注数据集是目前的热点，莲花山人工图像与视频标注数据集(LHI dataset)[1]便是其中之一。目前其数据量约为6万张图像、88万标注物体对象以及约88万帧视频画面、 676万标注物体。本文探讨怎样根据图语法模型进行视觉知识表达，并设计一个与莲花山图像数据集相配套的数据库框架。 ?? 　　在建设莲花山图像数据集的过程中遇到的问题有：?? 　　a)对怎样标注以及怎样表示通用视觉知识这两大视觉界数据集建设的难题，本文尝试作了解答。尤其是标注结果需要满足多种各不相同的视觉研究任务。?? 　　b)开发一个合适易用的标注工具，能够满足各种不同的标注任务。根据不同的视觉任务定义出一整套标注规则。?? 　　c)提出一个自顶向下的框架，以及相应的自动/半自动算法，用于规范与加速标注流程。?? 　　d)建设一个结构良好的数据库，在数据库中合适地表达视觉知识或视觉模型。?? 　　e)数据库发挥对模型与数据的桥接功能，将标注数据与分别来自