CrowdCLIP:通过视觉-语言模型实现无监督人群计数.pdfVIP

  • 3
  • 0
  • 约12.46万字
  • 约 26页
  • 2026-04-22 发布于北京
  • 举报

CrowdCLIP:通过视觉-语言模型实现无监督人群计数.pdf

CrowdCLIP:通过视觉‑语言模型进行无监督人群计数

∗1∗23321

丁克,,,,,

1华技大学,{dkliang,xbai}@2邮电大学,{

xiejiahao,xuwei2020}@3公司,

3

2

0

2

图像图像GT

r

编器密度图

p有监督的人群计数严重依赖于昂贵的手动标注,

A这在密集场景中尤其和昂贵。为了解决这个问题,监督方法:依赖于点级

9我们提出了一种新的无监督人群计数框架,称为

文档评论(0)

1亿VIP精品文档

相关文档