人工智能如何应用于智慧城市.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
人工智能如何应用于智慧城市   为提高人工智能在智慧城市等大型应用中的研究水平,真正做到平安城市、数字城市、宜居城市等,参考美国DARPA机器人挑战赛DRC、NIST组织TRECVID等的经验,有必要组织全国性的智能视频分析技术评测与竞赛,通过公开的技术评测来推动智能视频分析技术及其相关(交叉)学科的发展,并通过比赛锻炼技术研究人员和研究生的解决问题能力,适应大数据时代对计算机科学人才培养的特殊需求。   在此背景下,2013年3月24日举办的“智慧城市中的视频分析与评测”论坛中特设置了“专题互动”环节。该环节以圆桌论坛的形式:业内专家发表观点并与场内观众互动,对我国智慧城市建设过程中人工智能应用的问题与挑战进行了探讨、分析与求解。本刊对此进行了全面报道。   智能视频监控之虚拟现实技术   虚拟现实环境可以使用户产生等同于真实环境的体验。因此虚拟现实环境首先要构建模型。虚拟环境主要是靠一些图形来实现,它的数据主要来源于三个方面,一是人在机器上构建,像几何模型,由人依靠一些软件工具来构建;二是数学的方法,物理模型要通过一些数学的方程、算法。来产生一些物理的动态的感觉;三是通过数据。这些数据是直接采集的,包括照片、视频、图像,来构建三维模型。   现在视频资源越来越丰富,这是一个构建虚拟环境非常重要的数据来源,而且用图像构建的虚拟环境,逼真度非常高,但在三维特征及交互方面相对较弱。   怎么从图像上获取数据,得到图像当中的对象,通过单幅或者多幅的图像,把它进行模型化,这是一个值得探讨的方向。过去有人研究基于图像的建模,也就是基于图像的虚拟现实环境的技术。北京航空航天大学在这方面也做了一些尝试,构建了一个基于视频图像的素材来生成虚拟场景,包括场景对象的编辑、内容标注等基本内容,基础的就是结构分析、场景分割、场景分层等基本的图像处理。这个系统可以把一幅视频里面的人像抠下来,把它嵌入另外一个场景中,这在影视制作的后期中已经有应用。同时,还可以把一场足球赛的视频自动压缩成40多秒。把射门、点射这样的活动自动提取出来。例如把平面的书法转化成雕刻图像。以及光影的迁移,把一幅图像中的光影迁移到另外一幅图里面等。   目前这个系统还只是在二维的层次,还没有应用到三维的方面,在这方面的难度非常大。   我们到底从视频图像中可以获得什么呢?主要是从它的模型构建上来思考。首先,图像、视频也好,可以从中获得相机的参数,这是勿庸置疑的。第二是可以获得深度信息、纹理材质信息。第三可以得到光信息和光源,另外还可以得到自然现象的数据和它的物理作用,比如说可视的程度、下雪的影响、对道路的影响等等。   当然,还有就是对象的几何特征和术语、物理特征和数据、行为特征和推演。以及对象之间的交互信息。难点就在流气、柔体、场特征的数据的获取,以及它们之间的交互。   综上所述,能够提取的动作都是非常简单的,稍微复杂就做不了。所以就产生这样几个问题:一个是视频图像中对象的可识别性。上述中谈及分析、识别的问题,计算机识别可以做到和人的识别一样,但是它的这个图像对象的模型化就非常困难。二维的提取分割可以做,如果是三维的就很难做到,因为它可能需要围绕这个场景拍很多的图像,且要了解它的物理模型。目前可以做的就是对速度、碰撞进行捕捉,而要做一个流体的分析难度就非常大。几何模型在计算里表现为一种结构的数据。物理模型是表现为物理定律的算法,而行为模型是一种思维推理的规则,这个和人工智能相关。   二是图像对象之间的可融合性。现在业界很多人提出要搞无缝融合,我觉得真正做到无缝融合是不大可能的。因为它牵涉的东西太多。分辨率、拍照现场光线的强弱、相机参数等因素太多,就和天气预报一样只能相对准确。完全百分之百的准确不大可能实现。解决这方面的问题,一方面要有赖于各种算法,有赖于新型的采录原则与设备。设想如果能够采集到它的物理属性,那这个问题就游刃而解;另一方面就是终端相机,拿着相机把这个人绕一圈,就可以把他的三维模型建出来。然后在计算机里模拟出来。   总之,在这方面可以研究的问题很多,但水也是很深的。所以希望我们这些年轻同志。博士生、研究生可以在这方面进行更加深入的探讨。   大数据的感知与认知   目前,各种各样的数据越来越多,特别是每天都有庞大的视频数据信息产生。同时我们又想在这些里面获得认知。就如看到一张图片,就想马上知道它是什么内容。目前。感知和认知之间有一个很大的鸿沟。感知是在物理世界中,且还有很多的摄像头和传感器等感知设备,而认知是在人的大脑思维里。所以我们希望最大限度地把物理界的感知能够与人类智慧中的认知结合,但这是一个很难、很大的命题。   综合现在的研究现状,以及从长期的研讨结果分析,要解决这一命题有两条途径:一是对生命学科的研究。部分研究生命学科

文档评论(0)

yingzhiguo + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5243141323000000

1亿VIP精品文档

相关文档