- 1、本文档共11页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
当前文档由后花园网文自动生成,更多内容请访问 HTTP://WWW.HHYWW.NET
如何让机器看懂这个多彩世界
来源于:CNET科技资讯网
从茹毛饮血的蛮荒,到钢筋水泥的城市,人类逐步将自身能力投射到计算
机上。无论是计算能力,还是记忆能力,计算机的如今表现都堪称卓越。但仅
拥有这些还远远不够,我们期待计算机可以做得更多。一部风靡全球《星际穿
越》激起了无数人对探索浩瀚宇宙奥秘的渴望,也让许多人记住了Tars这个聪
明可爱、幽默风趣的智能机器人。人工智能主题的好莱坞电影一直广受影迷们
的喜爱,人类用无尽的想象力和炫目的特技构筑了一个又一个无比精彩的未来
世界,令人如痴如醉。不过,回到现实,计算机科学家们的行动力却看似远远
赶不上电影艺术家们的想象力,电影终归是电影,要研发出一个像Tars一样能
看懂周围世界、听懂人类语言、并和人类进行流畅对话的智能机器人,我们要
走的路还有很长。
长时间来,让计算机能看、能听、能说一直是我和计算机界同行们孜孜以
求的目标。耕耘在计算机视觉领域十余年,赋予计算机一双慧眼,让它也能看
懂这个多彩的世界,一直是激励着我在这条充满挑战的道路上前行的重要力量
。虽然计算机暂时还无法像电影中所展现的那般智能,但已经取得了很多令人
惊喜的成绩。在这篇文章中,我将就如何让计算机能“看”懂世界这个主题
,为大家介绍计算机视觉的基本概念、这个领域面临的挑战、一些带来重要突
破的技术并展望未来的演进趋势。
世界如何在我们眼中形成
对人类而言,“认人”似乎是与生俱来的本能,刚出生几天的婴儿就能模
仿父母的表情;它赋予我们只凭极少细节就分辨彼此的能力,借着暗淡灯光我
们仍能认出走廊那端的朋友。然而,这项对人类而言轻而易举的能力,对计算
机而言却举步维艰。过去很长一段时间,计算机视觉技术徘徊不前,在进一步
探求前,不如先谈谈我们是如何用眼睛观察世界的。
相信大家都在中学的物理课上尝过小孔成像的原理。不过人的眼睛要比小
孔成像复杂得多,当我们观察物体时,每秒大约扫视3次,并有1次驻留。当视
网膜的感光体感受到蜡烛的轮廓,一个被称为中央凹的区域其实是以扭曲变形
的形式记录下蜡烛的形状。
那么问题来了,为何我们看到的世界既未扭曲也没有变形呢?很简单,因
为人类拥有大脑皮层这个万能的“转换器”,它将我们的视觉神经捕捉到的信
号转换为真实的形象。这个“转换器”可简化理解为四个区域,生物学家将它
们分别称为V1、V2、V4和IT区。V1区的神经元,只针对整个视觉区域中很小的
一部分做出反应,例如,某些神经元发现一条直线,就变得异常活跃。这条直
线可以是任何事物的一部分,也许是桌边,也许是地板,也许是这篇文章某个
字符的笔划。眼睛每扫视一次,这部分神经元的活动就可能发生快速变化。
奥秘出现在大脑皮层顶层的IT区,生物学家发现,物体在视野的任何地方
出现(例如一张脸),某些神经元会一直处于固定的活跃状态中。也就是说
,人类的视觉辨识是从视网膜到IT区,神经系统从能识别细微特征,到逐渐变
为能识别目标。如果计算机视觉也可以拥有一个“转换器”,那么计算机识别
的效率将大为提高,人眼视觉神经的运作为计算机视觉技术的突破提供了启迪
。
计算机为何总是“雾里看花”
尽管人眼识别的奥秘已经被逐步揭开,但直接应用于计算机上却非易事。
我们会发现计算机识别总是在“雾里看花”,一旦光线、角度等发生变化,计
算机难以跟上环境的节奏,就会误识。对计算机而言,识别一个在不同环境下
的人,还不如识别在同一环境下的两个人来得简单。这是因为最初研究者试图
将人脸想象为一个模板,用机器学习的方法掌握模板的规律。然而人脸虽然看
起来是固定的,但角度、光线、打扮不同,样子也有差别,都令简单的模板难
以匹配所有人脸。
因此,人脸识别的核心问题在于,如何让计算机忽略同一个人的内部差异
,又能发现两个人之间的分别,即让同一个人相似,不同的人有别。
对人工
您可能关注的文档
- 大丰港经济开发区11000的地形测量项目.doc
- 大励磁控制系统的构成和方案.PDF
- 大华股份奋斗者驱动业绩重回高增长.PDF
- 大唐高鸿数据网络技术股份有限公司2016年年度报告补充更.PDF
- 大型邮件系统.PDF
- 大学生创新创业及美国文化深度体验项目汇总表.doc
- 大学生网瘾现象与对策①.PDF
- 大幅面打印机(绘图仪).doc
- 大族激光002008近看消费电子需求,远看钣金设备需求.PDF
- 大连冷冻机股份有限公司关于制冷设备管理咨询与节能服务合.PDF
- 2025四川省发展和改革委员会直属事业单位选调5人笔试参考题库附答案解析.docx
- 2025四川省公安厅所属事业单位选调1人笔试参考题库附答案解析.docx
- 2025四川西华师范大学招聘辅导员20人笔试参考题库附答案解析.docx
- 2025天津市卫生健康委员会所属天津市第三中心医院第二批次招聘6人笔试参考题库附答案解析.docx
- 2025农业农村部农业贸易促进中心博士后招收2人笔试参考题库附答案解析.docx
- 2025年郑州铁路职业技术学院辅导员招聘考试笔试参考题库附答案解析.docx
- 2022湖南外贸职业学院招聘笔试真题及答案详解1套.docx
- 2022曹妃甸职业技术学院招聘笔试真题含答案详解.docx
- 2022昌吉职业技术学院招聘笔试真题及答案详解一套.docx
- 2022新疆铁道职业技术学院招聘笔试真题含答案详解.docx
文档评论(0)