计算机用“三只眼”看懂世界.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
计算机用“三只眼”看懂世界.doc

计算机用“三只眼”看懂世界   何搏飞走进一栋破旧的居民楼,气喘吁吁地爬上了5层。他来到这里,完全是因为投资人徐小平的劝说:“我最后再向你推荐一个人,你一定要去看看。”   2013年4月,何搏飞辞去了一家美国上市公司中国区总经理的职务。他用几个月的时间在中国寻找创业伙伴,结果却让人失望。当时,他已经做好打算,和这个团队随便聊半个小时,然后就飞去美国硅谷。   何搏飞推开门,看见几个光着上身的年轻人坐在电脑前,整个屋子被各种大小的显示屏围绕。随后,他和团队CTO赵勇从下午两点一直聊到了凌晨两点,就决定加入担任CEO。这家公司的名字叫做“格灵深瞳”。   格灵深瞳是一家计算机视觉和人工智能的技术公司,通过深度数据和机器学习算法让计算机主动获取三维视觉信息,并进行精确的实时智能分析。简单来说,他们想让计算机像人一样,看见并理解这个世界。   “计算机视觉的技术已经存在了几十年,我们想要做第一个将计算机视觉商业化的公司。”何搏飞说。切入智能安防监控领域是格灵深瞳选择将计算机视觉商业化的第一步。今年6月,格灵深瞳获得了红杉资本数千万美元的A轮融资。10月,其智能安防系统开始在国有四大银行中的三大银行进行试点。   格灵深瞳CTO赵勇创业之前在Google工作,是Google Glass的核心研发团队成员之一。Google的工作原则是80/20,员工可以利用20%的时间自由创新。赵勇利用空闲的时间,重新开始研究自己在美国博士期间的研究方向―计算机视觉的人工智能。   计算机视觉过去主要建立在光学镜头采集的二维图像上。光学镜头在生成图像时,会丢失掉一个维度“深度”,只保留长度和宽度。当时人们觉得,通过二维图像加上算法,就能够让计算机看懂世界。但赵勇和他布朗大学的博士导师并不同意这个观点。他们坚持认为,计算机必须要通过三维信号才能够看懂这个世界。因此,他们主张要增加“深度”这一维度的信息。“我们有两只眼睛,就是为了判断深度。人脑比计算机聪明多少倍?人脑进行判断还需要三个维度的信息,计算机只通过两个维度怎么能够准确判断?”何搏飞对《第一财经周刊》说。格灵深瞳的这一代智能安防系统上一共装有3个镜头。一个是和普通安防系统一样的RGB摄像头,另外两个用来发射和接收激光。激光发射镜头能够在1/30秒的时间里发送36万束激光,安防系统借助它们扫描出现实世界的三维立体图像。   这3个镜头就相当于计算机的“眼睛”。格灵深瞳所做的,不仅是给计算机装上“眼睛”,而且给计算机设置了一套“视网膜神经系统”,让计算机能够看懂“眼睛”里出现的东西。   借助机器学习算法,格灵深瞳的系统能够同时分辨多人的运动轨迹和行动速度,并一一精确记录。比如早上8时的北京地铁站,人群正处于早高峰极端拥挤的状态,格灵深瞳可以从中分辨出一个穿红衣服的女孩,精确跟踪她在人群中的行走轨迹。同时,格灵深瞳的系统还能够监测人类肢体的运动幅度和速度,从而精确识别人们的姿势和正在做的事情。   最初,赵勇和团队已经解决了基本的技术问题,但还没有想好商业化应该选择的行业。办公区域前的大黑板上密密麻麻地写着80多条可能的商业化方向,包括安防、教育、医疗等等。这些是格灵深瞳团队的工程师们一个晚上头脑风暴之后的成果。   “你们这是科学家在实验室里想问题的方式。”熟悉商业的何搏飞对赵勇说。“如果格灵深瞳的目标是成为全球最好的计算机视觉和人工智能公司,最需要的是什么?”“海量的数据。”赵勇说。   要获得海量的数据,有两种方法。第一个是像Google街景一样,自己到各地去拍摄采集。另外一种,是通过现成的行业和设备实现。有没有一个行业,已经在所有能够采集数据的地方都装上了摄像头?赵勇和何搏飞同时想到了安防。安防是一个足够大的市场。2013年中国安防市场的复合增长率为30%,销售收入约为4000亿元。美国的摄像头与人口比是1:10,但在中国的北京和上海这个数字还只是1:50。   更难得的是,格灵深瞳的技术正可以解决安防领域目前面临的两个难题―看不见和找不到。一方面,一个安保人员往往要同时负责监看100多个摄像头,随便里面某个摄像头拍摄到突发事件,当时就被监控人员发现的可能性非常小。另一方面,想要查找监控录像中的某一段录像也非常困难,就算快进,一段6个小时的视频也得近1个小时才能看完。而格灵深瞳的智能计算机视觉系统可以很好地解决这些问题。   选择安防领域作为商业化切入口之后,赵勇和何搏飞开始分析市场和客户。他们发现安防系统在机场、火车站、广场等场景应用最多。但场景一多,很多东西就无法控制。他们希望首先找到一个具有高度可复制性的场景,他们将目光投向了银行。“中国的银行几乎都长得一模一样。由于银监会有严格的条例规定,它们的需求也都一样。而且银行本身底子厚,它们有很强的应用安防新技术的动

文档评论(0)

ganpeid + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档