- 1、本文档共51页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Deep Dream Given a photo, machine adds what it sees …… 1-3 经典模型-CNN 第三十一页,共五十一页。 Deep Style Given a photo, make its style like famous paintings 1-3 经典模型-CNN 第三十二页,共五十一页。 Deep Style Given a photo, make its style like famous paintings 1-3 经典模型-CNN 第三十三页,共五十一页。 Deep Style CNN CNN content style CNN ? A Neural Algorithm of Artistic Style 1-3 经典模型-CNN 第三十四页,共五十一页。 More Application: Speech Time Frequency Spectrogram CNN Image The filters move in the frequency direction. 1-3 经典模型-CNN 第三十五页,共五十一页。 More Application: Text ? 1-3 经典模型-CNN 第三十六页,共五十一页。 深度学习应用 第二章 机器视觉 智能语音 ………………. 第三十七页,共五十一页。 2-1 机器视觉 (1)机器视觉——用机器的眼睛理解世界 机器视觉是指通过用计算机或图像处理器及相关设备来模拟人类视觉,以让机器获取相关的视觉并加以理解,它是将图像转换成数字信号进行分析处理的技术。 机器视觉技术流程 图像采集 目标提取 目标识别 目标分析 图像捕获 图像压缩 图像存储 图像预处理 图像分割 特征提取 目标分类 判断匹配 模型建立 行为识别 第三十八页,共五十一页。 2-1 机器视觉 关键技术与应用 A)生物特征识别技术——安全领域应用广泛 生物特征识别技术是一种通过对生物特征识别和检测,对身伤实行鉴定的技术。从 统计意义上讲人类的指纹、虹膜等生理特征存在唯一性,可以作为鉴另用户身份 的依据。目前,生物特征识别技术主要用于身份识别,包括语音、指纹、人脸、 静脉,虹膜识别等。 第三十九页,共五十一页。 2-1 机器视觉 关键技术与应用 B )光学字符文本识别一一智能物流的核心技术 光学字符文本识别技术( Opical Character Reconrition),是指计算机通过光学设备检 查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形 状翻泽成计算机文字的过程,从而完成计算机对文字的阅读。OCR技术具体到场 景就是通过扫描,将各类印刷体的文档证件(名片,银行卡、财务单据等)自动识 别录入电脑等终端,让大量信息的高效录入成为可能。 物品包装检测系统 第四十页,共五十一页。 2-1 机器视觉 关键技术与应用 C )物体与场紧识别一机器人和自动驾驶使用最广 物体、场景识别是指计算机将图片内容与数据库中的资料进行比对,进而识别图片或视频中的物体与场景。识别过程与人脸识别类似,即通过检测定位、特征提取、3D建模、模型比对对物体进行识别。 机器人 机器规觉技术的应用打破了传统机器入应用的局哏性。以检测服务为例,在未配备机器视觉的条件下,由于被检产品规格的多样,用户需要使用大量的专用工具来实现产品位置的固定,成本过高,更换工具的工作量目大。而机器视觉技术具有位置无需固定、精度与J靠性的协调统一非接触式定位与测量全面观量、随动检测等特点,因此使用视觉系统定位仅需更换产品的检测文件,机械成本及更换工具时间大为降低。 自动驾驶 机器视觉技术在自动驾驶中可以识别、发现周遭环境和各类物体的运动状态; 定位车道、检测坡度与弯度;自动规划行车路线井控制车辆到达的地。目前,技术方面E 实现从感知到控制的飞跃,辅助驾驶成熟度大幅提升。深度学习的出现提高了对环境感知的精度,提供更全面的环境信息,提示危险,辅助驾驶。基于机器视觉的无人驾驶感知系统使用了多种规觉传感器,包括毫米波雷达、激光雷达和摄像头等。毫米波雷达用于测距; 激光雷达用于感知环境;摄像头用来识别交通信号和其他物体标准的数据集用来开发、验证基于视觉的算法; 底层的Optical Flow 与立体视觉技术对车辆定位和物体的识别与跟踪都至关重要。 第四十一页,共五十一页。 2-2 智能语音 语音识别的目标是将人类语音表达的内容转换为机器可读的输入,是构建机器
文档评论(0)