CN119722875A 一种文本生成图像方法、装置、设备及介质 (之江实验室).docxVIP

  • 3
  • 0
  • 约2.6万字
  • 约 40页
  • 2026-06-15 发布于山西
  • 举报

CN119722875A 一种文本生成图像方法、装置、设备及介质 (之江实验室).docx

(19)国家知识产权局

(12)发明专利申请

(10)申请公布号CN119722875A

(43)申请公布日2025.03.28

(21)申请号202510244910.2

(22)申请日2025.03.03

(71)申请人之江实验室

地址311121浙江省杭州市余杭区中泰街

道科创大道之江实验室

(72)发明人李超姚柯璐吕程辉

(74)专利代理机构广州三环专利商标代理有限

公司44202

专利代理师戴莉

(51)Int.Cl.

G06T11/60(2006.01)

G06N3/045(2023.01)

G06N3/084(2023.01)

权利要求书2页说明书15页附图5页

(54)发明名称

一种文本生成图像方法、装置、设备及介质

(57)摘要

CN119722875A本申请涉及图像处理技术领域,公开了一种文本生成图像方法、装置、设备及介质,其中,方法包括:响应于获取到的包含目标对象的文本提示词,生成文本提示词对应的初始图像;其中,文本提示词包括目标对象的目标数量,初始图像包括目标对象的生成数量;在目标数量与生成数量不相等的情况下,对初始图像生成过程中的候选边界框的位置进行优化,生成优化后的边界框;基于优化后的边界框对初始图像生成过程中的当前潜在表示进行优化,得到目标潜在表示;基于目标潜在表示更新初始图像,生成目标

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档