- 1、本文档共65页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
项目8让机器拥有“视觉感知”Powerpointdesign2025/5/13时间:Powerpoint
任务8.1图像分类——智能垃圾箱Powerpointdesign2025/5/13时间:Powerpoint
Catalogue目录预备知识2.1.任务描述实施过程3.
01任务描述Powerpoint
01随着国家对垃圾分类的重视,越来越多的城市开始实施生活垃圾强制分类。然而,居民垃圾分类习惯的培养需要时间,且垃圾分类监控和辅助分类成为政府、环保部门的痛点问题。某江浙地区的环保科技公司希望通过AI技术对居民投放的垃圾进行分类,以智能垃圾箱的形式来监管居民的垃圾投放,并建立垃圾回收的生态。业务背景
AI模型的训练需要大量的标注数据,标注成本高且效率低。模型效果调优周期长,需要反复添加数据进行模型迭代,效率低下。智能垃圾箱处于户外,联网条件不稳定,需要边缘硬件部署AI能力,批量硬件部署成本高,部署效率低下。业务难点
使用EasyDL图像分类任务,无需了解AI算法知识,提交少量图片进行训练,很快即可获得能够识别各类垃圾照片的AI模型。标注少量数据后可使用智能标注功能,完成大量原始数据的标注,来进行模型训练与迭代。EasyDL还提供软硬一体方案,将AI模型部署在性价比高的百度EdgeBoard智算盒,多路摄像头分别对应不同垃圾箱传送带推理,高性能进行AI应用,满足实施识别居民垃圾投放的场景需求。解决方案
02预备知识Powerpoint
计算机视觉的主要任务就是通过对采集的图片或视频进行处理以获得相应场景的信息。计算机视觉任务如下:01物体检测:用框标出物体的位置,并给出物体的类别,解决“在哪”的问题。图像分类:给输入图像分配标签的任务,解决“有”“无”的问题。图像分割:在图像处理过程中,有时会需要对图像进行分割来提取有价值的用于后继处理的部分,图像分割是像素级操作,解决“有几类”(语义分割)、“每类有几个”(实例分割)的问题。020304计算机视觉任务
计算机视觉任务
图像分类概念图像分类是计算机视觉中重要的基本任务,也是物体检测、目标分割、目标跟踪、行为分析等其他高层视觉任务的基础。一般来说,图像分类通过提取图像的特征对整个图像进行全部描述,然后使用分类器判别物体类别,因此如何提取图像的特征至关重要。基于深度学习的图像分类方法,通过层次化的特征描述,取代了手工提取图像的特征的工作。图像分类
图像分类过程传统图像分类方法可以用三步完成,但通常完整建立图像识别模型一般包括底层特征学习、特征编码、空间约束、分类器设计、模型融合等几个阶段。而基于深度学习的图像分类过程如图8.2所示。图像分类
图像分类的困难一个好的模型既要对不同类别识别正确,同时也应该能够对不同视角、光照、背景、变形或部分遮挡的图像正确识别。图8.3展示了一些图像的扰动,较好的模型会像聪明的人类一样能够正确识别。图像分类
图像分类的类别1)跨物种语义级别的图像分类所谓跨物种语义级别的图像分类,它是在不同物种的层次上识别不同类别的对象,比较常见的包括如猫狗分类等。这样的图像分类,各个类别之间因为属于不同的物种或大类,往往具有较大的类间方差,而类内则具有较小的类内误差。图8.4是cifar10数据集中的10个类别的示意图。图像分类
图像分类的类别2)细粒度图像分类这是在区分出基本类别的基础上,进行更精细的子类划分,如区分鸟的种类、车的款式、狗的品种等,目前在工业界和实际生活中有着广泛的业务需求和应用场景。细粒度图像相较于粗粒度图像具有更加相似的外观和特征,加之采集中存在姿态、视角、光照、遮挡、背景干扰等影响,导致数据呈现类间差异性大、类内差异性小的现象,从而使分类更加具有难度(图8.5)。图像分类
图像分类的类别3)多标签图像分类现实生活中的图片中往往包含多个类别的物体,相较于多类别图像分类,这也更加符合人的认知习惯。多标签图像分类可以告知我们图像中是否同时包含这些内容。图像分类
图像分类的类别4)?实例级图像分类如果我们要区分不同的个体,而不仅仅是物种类或者子类,那就是一个识别问题,或者说是实例级别的图像分类,最典型的任务就是人脸识别(图8.7)。图像分类
图像分类的应用1)医学图像病灶分类(良性、恶性)。2)教育行业中,根据人脸特征,记录学生的听课状态(打盹、走神、小动作、举手等)。3)交通行业中,自动识别违规驾驶员(接电话、不系安全带)、车牌识别、交通标识识别等。4)视频分类,视频分类一般有:搞笑、美食、时尚、旅游、娱乐、生活、资讯、亲子、知识、游戏、汽车、财经、萌宠、运动、音乐、动漫、科技、健康等。图像分类
EasyDL基于飞桨开源深度学习平台,面向企业AI应用开发者提供零门槛AI开发平台,实现零算法基础定制高精度AI模型。EasyDL提供一站式的智能
您可能关注的文档
- DB62T 4139-2020 循环型社区建设规范.pdf
- DB62T 4118-2020 碧桃栽培技术规程.pdf
- DB62T 4135-2020 抗冲改性聚氯乙烯(PVC-M)管材高速冲击试验方法.pdf
- DB62T 4149-2020 绵羊腹腔镜输精技术规程.pdf
- DB62T 4157-2020 杂交构树袋装发酵饲料生产技术规范.pdf
- DB44_T 2608-2025 伴生放射性矿开发利用场地土壤放射性污染状况调查技术导则.pdf
- DB44_T 2607.4-2025 滨海蓝碳碳汇能力调查与核算技术指南 第4部分:盐沼.pdf
- DB43_T 3178-2024 烟叶农场建设管理要求.pdf
- DB37_T 4838-2025 含氢分布式综合能源系统运行优化指南.pdf
- DB37_T 4834-2025 高速公路集中养护工作指南.pdf
- DB44_T 2611-2025 城市排水管网有毒有害气体监测与风险分级管理技术标准.pdf
- DB44_T 2612-2025 竞赛类科普活动策划与实施服务规范.pdf
- DB43_T 2947-2024 烟草种子质量控制规程.pdf
- DB37_T 4836-2025 煤矿风量实时监测技术要求.pdf
- 叉车防撞系统,全球前22强生产商排名及市场份额(by QYResearch).docx
- 超滤膜,全球前18强生产商排名及市场份额(by QYResearch).docx
- DB62T 4172-2020 玉米品种 酒623规范.pdf
- DB62T 4160-2020 在用真空绝热深冷压力容器综合性能在线检测方法.pdf
- DB62T 4164-2020 辣椒品种 酒椒1号.pdf
- DB62T 4133-2020 公路隧道地质超前预报机械能无损探测技术规程.pdf
文档评论(0)