- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于Kinect人流监测图像采集
基于Kinect人流监测图像采集
摘 要:为实现行人运动目标检测,需要对目标运动场景进行采集,包括彩色信息和深度信息。然而在图像形成和传输过程中,会受到环境、光照等多种因素影响,采集到的信息与实际场景相比存在降质或退化问题。因此,在进行行人运动目标识别分割之前,需要对原始图像进行预处理。介绍了采集原始图像的硬件设备Kinect 2.0传感器;根据深度成像原理,分析了深度图像的预处理算法。
?P键词:Kinect传感器;图像采集;深度成像
DOIDOI:10.11907/rjdk.171254
中图分类号:TP317.4
文献标识码:A 文章编号:1672-7800(2017)007-0202-03
0 引言
大型城市人口过度集中已经成为一个公认的社会问题,对一些场所和地区进行人流统计,基于人流统计信息进行决策管理,以合理利用与分配社会公共资源。在展览馆、博物馆、大型商场、飞机场、火车站、地铁站和旅游景区等人流高密集场所,人流数量、滞留人数、人流规律、人数趋势等信息能够帮助决策与调度,有效提高行人的便捷出行。同时,根据人流统计数据,可以提前进行区域限流,防止由于人群密度过高、不容易疏散而引起踩踏等安全隐患或社会动乱,避免人身安全受到威胁。
目前,针对机器视觉的视频人流统计,主要涉及到行人目标的识别、检测和跟踪、计数,有很多相对成熟的算法,但大多算法面临背景和光线的干扰,以及多目标的遮挡和伪目标的误检等问题,高准确率、高鲁棒性的人数统计是研究热点和难点。基于视频的人数统计面临很多技术难题。因此,无论在技术上,还是在学术研究领域,运动目标的分割与检测技术均具有深远的现实意义及研究价值。
1 国内外研究现状
人流统计的智能化、无监督化、自动化是目前发展的重点。国外针对运动跟踪等机器视觉领域有专门的ICCV(International Conference on Computer Vision)、ECCV(European Conference on Computer Vision)、CVPR(IEEE conference on Computer Vision and Pattern Recognition)等顶级国际会议,还有PAMI(IEEE Transaction on Pattern Analysis and Machine Intelligence)、CVIU(Computer Vision and Image Understanding)、IJCV(International Journal on Computer Vision)和PR(Pattern Recognition)等权威期刊[1]。学者在这些会议和期刊上发表的关于视频人数统计的最新进展,具有巨大的参考意义和研究价值。
国内也举办一些机器视觉方面的学术会议。自2002年始,全国智能视觉监控学术会议(Chinese Conference on Intelligent Visual Surveillance,IVS)已成功举办了4届,还有中国机器学习及其应用研讨会(China Workshop on Machine Learning and Applications,MLA)、亚洲计算机视觉会议(Asian Conference on Computer Vision,ACCV)等,为计算机视觉研究者和企业提供了技术交流平台。
2 Kinect软件结构
Kinect 2.0传感器可根据微软公司的Kinect For Windows的NUI库,结合用户开发的算法程序和OpenCV等开源库进行软件设计。Kinect For Windows架构如图1所示。
Kinect传感器把图像数据、深度信息和音频通过USB 3.0接口传输至NUI库,NUI库隐藏了复杂的硬件操作,用户应用程序只需调用NUI API访问,包括彩色图像、深度图像、音频信息和骨骼信息等几种类型数据。使用NUI库获取并处理数据源流程如图2所示。
Sensor代表一个具体的硬件实体,一个应用程序可以调用一个或者一个以上的传感器(默认为1个),随后调用Source,显示数据源的元数据,并为阅读器(Reader)提供获取途径,传感器的深度帧、彩色帧以及音频源等都会提供一种数据源供用户调用。Reader提供获取帧的途径,包括事件机制(触发模型)和轮询机制(“拉”模型),一种数据源可以有多个阅读器(Reader),阅读器也可以被暂停。帧Frame分为Frame References和Frames,Frame References发送帧事件参数,包括获得实际帧使用方法、被引用帧的时间戳等具体信息;Frames提供获取帧数据的途径(建
原创力文档


文档评论(0)