36Kr-计算机视觉行业研究报告-机器之眼, 看懂世界.pptxVIP

36Kr-计算机视觉行业研究报告-机器之眼, 看懂世界.pptx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
机器之眼, 看懂世界;目 录 Contents;;;计算机视觉作为计算机的眼睛,是机器认识世界、看懂世界的一种 方式。而认识世界、看懂世界是人工智能产品或方案不可或缺的重 要部分。唯有看见,才能够做出分析判断,进而代替人类完成更多 的任务。它与语音识别、语言识别一并构成了人工智能的感知智能, 让机器完成对外部世界的探测,进而做出判断,采取行动,让更复 杂层面的智慧决策、自主行动成为可能。 基于深度学习算法模型和CPU、GPU等关键硬件的支撑,计算机视 觉技术应用得以实现,并最终集成于多类产品和应用场景之中(如 机器人、无人驾驶等等)。;数据量、运算力和算法模型是影响计算机视觉行业发展的三大要素。 2000年之后,数据量的上涨、运算力的提升和深度学习算法的出现 极大的促进了计算机视觉行业的发展。 要理解数据量的重要性,得先从算法说起。数据量和算法可以分别 比作人工智能的燃料和发动机。算法是计算机基于所训练的数据集 归纳出的识别逻辑,好的算法模型可以实现精准的物体和场景识别。 而数据集的丰富性和大规模性对算法的训练尤为重要。因此可以说, 实现机器精准视觉识别的第一步,就是获取海量而优质的应用场景 数据。以人脸识别为例,训练该算法模型的图片数据量至少应为百 万级别。;在计算机视觉领域,图像、视频作为数据密集型问题,需要大量的 矩阵计算操作,因此特别适合使用并行运算芯片进行数据处理。而 传统的CPU一次只能同时做一两个加减法运算,无法满足并行运算 的需求。;深度学习可以做到传统视觉识别方法无法企及的精度, 它的出现让 视觉识别准确率大大提高。计算机视觉技术的发展大致经历两大阶 段:;;。;Venture Scanner 追踪了全球957家人工智能公司,总融资额为48 亿美金。其中,机器学习、自然语言处理、计算机视觉等认知技术 占据当前市场主导地位。;;;;;生物特征识别技术是一种通过对生物特征的识别和检测从而对人的 身份实行鉴定的技术。从统计的意义上讲,人类的指纹、掌形、虹 膜等生理特征存在着唯一性。因而这些特征都可以作为鉴别用户身 份的依据。目前,生物特征识别主要用于用户身份的鉴定,主要包 括指纹识别、人脸识别、静脉识别、虹膜识别、语音识别等方式。;识别步骤:与其他生物特征识别步骤类似,人脸识别包括图像采集、 检测定位、特征提取、模型对比等步骤。;;光学字符文本识别技术又称OCR技术(Optical Character Recognition)。计算机通过光学设备检查纸上打印的字符,通过检 测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计 算机文字的过程,完成计算机对文字的阅读。;;识别步骤:物体、场景识别是计算机将图片内容与数据库中的资料 进行比对,进而识别图片或视频中的各种物体与场景的识别技术。 识别的过程与人脸识别类似,即通过检测定位、特征提取、三维建 模、模型比对的过程进行物体的识别。下图即为一个典型的驾驶环 境下的物体与场景识别。;;家用机器人:处于产业化初期,整体智能程度低;计算机视觉作为机器感知周围环境的基础技术,对驾驶的自动化起 到重大作用。计算机视觉可以帮助汽车完成:(1)环境数据和地标收 集(2)车道的定位、坡道与弯度的检测(3)交通信号的识别(4)车辆、 行人等运动目标检测.;;监控系统、行为识别、电商营销是目前视频识别与分析应用商业化 较为成熟的三个领域。;;;;;;(2)软硬件一体??技术解决方案 此类企业提供的是具体应用场景的技术解决方案。通过售卖硬件+ 软件服务,更加个性化的满足客户需求。 软硬件结合的优点是能够在前端硬件设备上嵌入算法软件,实现更 快速、更高精度地数据处理。此外,能够让客户更直接的应用视觉 识别技术,避免对接复杂的软硬件的兼容集成。 按照按照是否面对终端客户,视觉技术服务商又可分为:;我们将从事计算机视觉的公司分为三类:工业巨头、互联网巨头和 创业公司,并总结了市场竞争现状与发展预期。;;国内部分创业公司信息梳理(续前页);? 智能前端化大势所趋:;在人工智能领域,对数据量的重视不能更多。假如把算法比作计算 机视觉的发动机,数据量比作燃料,那么基于应用场景的大数据集 则是优质燃料。;“在人工智能和机器学习上我们已经取得巨大的进步,但是今天就宣 布取得了机器学习的成功就像是「我们爬上了树梢却宣布自己登上了 月球」。“

文档评论(0)

wnqwwy20 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:7014141164000003

1亿VIP精品文档

相关文档