- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
50
50 2023/07/DTPT
基于图像分割及修复的数据生成
1概述
随着深度学习及大模型技术的发展,数据变得愈发重要。但特殊场景的数据存在数据量少、收集困难等问题,此外在已收集的数据中往往包含车牌、人脸等隐私数据以及一些其他的敏感数据。在以往的研究中,对于小样本任务的处理,往往采用迁移学习进行微调参数学习;对于敏感及隐私数据源,往往在数据上进行马赛克处理,遮挡敏感数据。
——————————
收稿日期:2023-05-26
本文提出一种基于图像分割[1]和图像修复[2]技术的数据生成流程结构。该方法在用户输入的指导下,基于最新的任意物体分割模型自动选取合适的目标图像区域,接着采用前沿的图像填充技术,将选中的目标区域结合周围像素生成目标图像,进而生成一组新的数字图像。同时,该结构还可以结合图像生成大模型,基于现有图像,在指定区域生成新的目标样本或者保留现有目标,更换背景生成新的场景图像。
2技术方案
本文重点介绍指定物体消除式数据生成结构,该
架构包含以下3个部分:交互式区域选择、图像自动分割、图像自动修复,同时也可以扩展应用到目标替换和背景替换。数据生成结构如图1所示。
自动修复
为模型提供更多的引导信息,适用于背景复杂的场景以及精确选择目标分割的场景。
2.2图像分割
与检测和识别任务类似,目标分割任务兴起时也预先定义了多个目标类别,并准备大量标注数据,因此早期目标分割的研究方向集中在特定目标分割领
交互选择 自动分割
图1数据生成结构
2.1交互选择
目标替换背景替换
域,而具有交互输入的任意物体分割算法研究相对较少。
特定目标分割或者语义分割往往只关注预定义好的目标类别,并且不需要交互输入,能自动在图像中分割出特定的目标区域,比如只关注人像的分割称为人像分割[3],只关注天空的分割称为天空分割[4]等。该种分割算法的特点是往往只关注某一大类目标,并
交互选择是选择给定图中的目标物区域,包括点
选以及框选2种方式。点选是指单次点击目标区域,分割模型根据点击位置自动分割出目标的掩码;框选是预先指定一个目标区域,然后分割模型自动在目标区域内分割出目标掩码。
点选包含正样本点选择和负样本点选择,正样本点明确当前位置是目标,负样本点明确当前位置为背景区域。点选过程可以是一次性输入所有正负样本点,进而通过模型直接获得分割结果;也可以是渐进式选择,即在上一步点选及分割结果的基础上,根据分割效果,选择加入正样本或者负样本点,以达到进一步优化分割效果的目标。综上所述,点选的优点是选择快速,不限制选择范围,比如显著的大目标,仅仅通过一次点击,就可完成大目标分割;而点选的缺点是在相对复杂的背景中,如果仅通过单次点击选择不能精确锁定目标,需要根据分割结果进行多次调整选择,而每次调整都会进行模型的推理,耗时较多。总体来说,在实际应用中,相对于背景突出的简单目标推荐选择该种方式。
框选是指在目标周围提前选定好范围,相比于点选,该方式明确了目标主要集中的区域;对于模型来说,输入的引导信息更丰富。具体地,框选包括四边形以及任意多边形(通常大于四边形)。在实际使用中常见的方式是四边形,该种方式规定了目标在图像中的左上及右下位置。另一种更精确的方式是任意多边形,任意多边形构成了一个不规则的封闭区域,更好地约束了目标所在的区域范围。一个极端的多边形可以直接是目标区域,相当于直接指定了目标的所有边界点,并不需要分割。总体来说,框选方式能
不关注图像中的其他类别目标。通常语义分割只关注指定类别,而不对同一类别的不同个体做区分,比如人像语义分割,最终输出结果是所有人像的掩码区域,并不区分人像个体。在语义分割基础上进一步区分每个目标的个体则被称为实例分割,比如人像实例分割,需要分割出每个人的掩码区域。
任意目标分割或者交互式分割是预先不指定目标类别,通过用户交互式提示,分割出用户想要的目标区域。因此不论是点选还是框选交互,都作为分割模型的一个输入,旨在获得目标的精确掩码。与特定目标分割相比,交互式分割具有以下优点。
a)简单交互便能够获得较好的分割结果。b)比语义分割和全景分割更具有针对性,对单个
物体的分割效果也较优。
c)由于分割一般只集中在用户需要分割的部分图像,所以计算复杂度不高,运行时间短。
d)训练过程中多数使用的是类别不可知方式,因此对没有出现的类别有一定的泛化能力。
u在深度学习兴起之前,交互式分割的主流方法是优化算法,交互的主要形式是划线,然后利用图论的方法建立能量方程,通过最小化能量方程的方式迭代得到分割结果。由于是基于优化的实现过程,这类方法的分割效果一般,但这
您可能关注的文档
最近下载
- 高中数学人教版新教材1.4.1.用空间向量研究直线、平面的位置关系(第1课时)教学设计.docx VIP
- 2025恒瑞杯中国内部审计准则知识竞赛题库答案.doc VIP
- 武汉纺织大学2019-2020学年第二学期19级《公共艺术美术篇》期末考试试卷.docx VIP
- 行业标准:T∕CEA 022-2019 电梯用随行电缆.pdf VIP
- 广西中医药大学2020级《中医外治学》期末考试试卷.docx VIP
- 绿化养护安全生产管理制度.docx VIP
- 广东医科大学2020年第一学期护理专业《医患沟通与技巧》期末考试试卷.docx VIP
- 食堂食材副食品配送服务食材质量保证措施及承诺.docx VIP
- 单位工程施工质量检验资料核查表.docx VIP
- 北京师范大学珠海分校2019-2020学年第二学期《管理学与人力资源管理》期末考试.docx VIP
原创力文档


文档评论(0)