36Kr-计算机视觉行业研究报告-机器之眼, 看懂世界.pptxVIP

下载本文档

5
0
约1.82千字
约 38页
2017-12-14 发布于浙江
举报
版权申诉

36Kr-计算机视觉行业研究报告-机器之眼, 看懂世界.pptx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

机器之眼, 看懂世界;目录 Contents;;;计算机视觉作为计算机的眼睛，是机器认识世界、看懂世界的一种方式。而认识世界、看懂世界是人工智能产品或方案不可或缺的重要部分。唯有看见，才能够做出分析判断，进而代替人类完成更多的任务。它与语音识别、语言识别一并构成了人工智能的感知智能，让机器完成对外部世界的探测，进而做出判断，采取行动，让更复杂层面的智慧决策、自主行动成为可能。基于深度学习算法模型和CPU、GPU等关键硬件的支撑，计算机视觉技术应用得以实现，并最终集成于多类产品和应用场景之中（如机器人、无人驾驶等等）。;数据量、运算力和算法模型是影响计算机视觉行业发展的三大要素。 2000年之后，数据量的上涨、运算力的提升和深度学习算法的出现极大的促进了计算机视觉行业的发展。要理解数据量的重要性，得先从算法说起。数据量和算法可以分别比作人工智能的燃料和发动机。算法是计算机基于所训练的数据集归纳出的识别逻辑，好的算法模型可以实现精准的物体和场景识别。而数据集的丰富性和大规模性对算法的训练尤为重要。因此可以说，实现机器精准视觉识别的第一步，就是获取海量而优质的应用场景数据。以人脸识别为例，训练该算法模型的图片数据量至少应为百万级别。;在计算机视觉领域，图像、视频作为数据密集型问题，需要大量的矩阵计算操作，因此特别适合使用并行运算芯片进行数据处理。而传统的CPU一次只能同时做一两个加减法运算，无法满足并行运算的需求。;深度学习可以做到传统视觉识别方法无法企及的精度, 它的出现让视觉识别准确率大大提高。计算机视觉技术的发展大致经历两大阶段：;;。;Venture Scanner 追踪了全球957家人工智能公司，总融资额为48 亿美金。其中，机器学习、自然语言处理、计算机视觉等认知技术占据当前市场主导地位。;;;;;生物特征识别技术是一种通过对生物特征的识别和检测从而对人的身份实行鉴定的技术。从统计的意义上讲，人类的指纹、掌形、虹膜等生理特征存在着唯一性。因而这些特征都可以作为鉴别用户身份的依据。目前，生物特征识别主要用于用户身份的鉴定，主要包括指纹识别、人脸识别、静脉识别、虹膜识别、语音识别等方式。;识别步骤：与其他生物特征识别步骤类似，人脸识别包括图像采集、检测定位、特征提取、模型对比等步骤。;;光学字符文本识别技术又称OCR技术（Optical Character Recognition)。计算机通过光学设备检查纸上打印的字符，通过检测暗、亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机文字的过程，完成计算机对文字的阅读。;;识别步骤：物体、场景识别是计算机将图片内容与数据库中的资料进行比对，进而识别图片或视频中的各种物体与场景的识别技术。识别的过程与人脸识别类似，即通过检测定位、特征提取、三维建模、模型比对的过程进行物体的识别。下图即为一个典型的驾驶环境下的物体与场景识别。;;家用机器人：处于产业化初期，整体智能程度低;计算机视觉作为机器感知周围环境的基础技术，对驾驶的自动化起到重大作用。计算机视觉可以帮助汽车完成:(1）环境数据和地标收集(2)车道的定位、坡道与弯度的检测(3)交通信号的识别(4)车辆、行人等运动目标检测.;;监控系统、行为识别、电商营销是目前视频识别与分析应用商业化较为成熟的三个领域。;;;;;;(2)软硬件一体??技术解决方案此类企业提供的是具体应用场景的技术解决方案。通过售卖硬件+ 软件服务，更加个性化的满足客户需求。软硬件结合的优点是能够在前端硬件设备上嵌入算法软件，实现更快速、更高精度地数据处理。此外，能够让客户更直接的应用视觉识别技术，避免对接复杂的软硬件的兼容集成。按照按照是否面对终端客户，视觉技术服务商又可分为：;我们将从事计算机视觉的公司分为三类：工业巨头、互联网巨头和创业公司，并总结了市场竞争现状与发展预期。;;国内部分创业公司信息梳理（续前页）;? 智能前端化大势所趋：;在人工智能领域，对数据量的重视不能更多。假如把算法比作计算机视觉的发动机，数据量比作燃料，那么基于应用场景的大数据集则是优质燃料。;“在人工智能和机器学习上我们已经取得巨大的进步，但是今天就宣布取得了机器学习的成功就像是「我们爬上了树梢却宣布自己登上了月球」。“