WO2025139962A1 图像处理模型的训练方法、图像处理方法及装置 (苏州镁伽科技有限公司).docxVIP

WO2025139962A1 图像处理模型的训练方法、图像处理方法及装置 (苏州镁伽科技有限公司).docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

(12)按照专利合作条约所公布的国际申请

(19)世界知识产权组织国际局

(43)国际公布日

2025年7月3日(03.07.2025)WIPOIPCT

(10)国际公布号

WO2025/139962A1

(51)专利(2:2.01)G06V30/18(2022.01)

G06T11/60(2006.01)

(21)国际申请号:PCT/CN2024/140309

(22)国际申请日:2024年12月18日(18.12.2024)

(25)申请语言:中文

(26)公布语言:中文

(30)优先权:

202311813675.32023年12月27日(27.12.2023)CN

(71)申请人:苏州镁伽科技有限公司(SUZHOUMEGAROBOTECHNOLOGIESCO.,LTD.)[CN/CN];中国江苏省苏州市中国(江苏)自由

贸易试验区苏州片区苏州工业园区玲珑街88号215000(CN)。

(72)发明人:徐海俊(XU,Haijun);中国江苏省苏州市中国(江苏)自由贸易试验区苏州片区苏州工业园区玲珑街88号215000(CN)。韩晓(HAN,Xiao);中国江苏省苏州市中国(江苏)自由贸易试验区苏州片区苏州工业园区玲珑街88号215000(CN)。

(74)代理人:北京集佳知识产权代理有限公司(UNITALENATTORNEYSATLAWCO.,LTD.);中国北京市朝阳区建国门外大街22号赛特广场七层100004(CN)。

(81)指定国(除另有指明,要求每一种可提供的国家保护):AE,AG,AL,AM,AO,AT,AU,AZ,BA,BB,BG,

BH,BN,BR,BW,BY,BZ,CA,CH,CL,CN,CO,CR,CU,

CV,CZ,DE,DJ,DK,DM,DO,DZ,EC,EE,EG,ES,FI,

WO2025/139662A1

WO2025/139662A1

(54)Title:IMAGEPROCESSINGMODELTRAININGMETHOD,ANDIMAGEPROCESSINGMETHODANDAPPARATUS

(54)发明名称:图像处理模型的训练方法、图像处理方法及装置

S110

S120

S130

获取第一图像和对应的正样本标签,其中,

第一图像中包括第一文本,正样本标签包括

第一文本的真实性的信息

利用文本生成工具,获得第二图像以度对应

的负辉本标签,其中,第二图像中包括利用

文本生成工真所生成的第二文本,负样本标

签包括第二文本的真实性的信息和文本识别

信息

将第一图像和第二图像均输入到文本判断模

型,以由文本判断模型输出检测结果,将第

二图像输入到文本检测模型,以由文本识别

模型输出文本识别结果,基于正样本标签、

负样本标签、文本识别结果和检测结果,计

算图像处理模型的损失位,利用损失值调整

图像处理模型对应的参数,以训练图像处理

模型

Acquireafirstimageandacorrespondingpositive

sampletag,thefirstimagecomprisingfirsttext,andthepositive

sampletagcomprisingauthenicityinformationofthefirsttextS120Usingatextgenerationtool,obtainasecondimageand

acorrespondingnegativesampletag,thesecondimage

comprisingsecondtextgeneratedusingthetextgenerationtool,andthenegativesampletagcomprisingauthenticityinformation

andtextrecognitioninformationofthesecondtext

$130Inputboththefirstimageandthesecondima

您可能关注的文档

文档评论(0)

xm + 关注
实名认证
文档贡献者

专业学习资料,专业文档

1亿VIP精品文档

相关文档