- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
JournalofMachineLearningResearch(2025)1-1Submitted;Published
无注释的病理学中视觉语言模型的轻松专业化
JingnaQiujingna.qiu@fau.de
NishanthJainnishanth.jain@fau.de
Friedrich-Alexander-UniversitätErlangen-Nürnberg,Erlangen,Germany
JonasAmmelingjonas.ammeling@thi.de
IngolstadtUniversityofAppliedSciences.Ingolstadt,Germany
MarcAubrevillemarc.aubreville@hs-flensburg.de
FlensburgUniversityofAppliedSciences,Flensburg,Germany
KatharinaBreiningerkatharina.breininger@uni-wuerzburg.de
本Julius-Maximilians-UniversitätWürzburg,Würzburg,Germany
译
中
Editor:
1
v
5
3Abstract
8
7最近在组织病理学中关于cro:vlmVision-LanguageModels(VLMs)的进展,例如CONCH
0
.和QuiltNet,已经展示了跨各种任务的令人印象深刻的零样本分类能力。然而,它们通用
8
0的设计可能导致在特定下游应用中的性能不佳。虽然监督微调方法解决了这一问题,但它
5们需要手动标记的样本来进行调整。本文研究了通过继续预训练来实现VLMs的无注释适
2
:应,这些预训练是基于从现有数据库中提取的相关领域和任务图像-标题对进行的。我们在
v
i两个VLMs,即CONCH和QuiltNet,在三个下游任务上的实验表明,这些配对显著提升
x
r了零样本和少量样本的表现。值得注意的是,随着训练规模的增大,继续预训练可以达到
a
与少量样本方法相当的性能,同时消除了手动标注的需求。其有效性、任务无关的设计以
及无注释的工作流程使其成为将VLMs适应新组织病理学任务的一种有前景的方法。代码
可在/DeepMicroscopy/Annotation-free-VLM-specialization获取。
Keywords:视觉-语言模型,组织病理学,任务适应
1介绍
cro:vlmVision-LanguageModels(VLMs)整合图像和文本描述以改进表示学习。它们在
自然图像数据集上的成功推动了其适应用于组织病理学图像分析。几种专门针对组织病理
学的VLMs已被开发,包括PLIP(Huangetal.(2023))、QuiltNet(Ikezogwoetal.(2023))
和CONCH(Luetal.(2024))。PLIP和QuiltNet对CLIP进行微调(Radfordetal.
(2021)),其中PLIP使用来自病理学家Twitter讨论中的图像-标题配对,而QuiltNet则利
您可能关注的文档
- 在生成手语中表达情感的挑战与机遇.pdf
- 通过混合异常检测保障生成式 AI 在临床前成像中的应用安全.pdf
- 元离线策略估计.pdf
- 弥散盲点:使用扩散模型合成子宫 MRI.pdf
- 尚未对心灵应用 AlphaFold:评估 Centaur 作为合成参与者的能力.pdf
- 多智能体系统在化学工程中的应用:综述与展望.pdf
- GPU 加速的量子 LDPC 码综合解码低于 63 微秒延迟阈值.pdf
- 推荐 菜肴趁热吃更佳.pdf
- 混合现实辅助成人注意缺陷多动障碍症状的挑战.pdf
- 半导体微结构的形态学分析使用骨架图.pdf
- KIRETT: 基于知识图谱的智能救援操作治疗助手.pdf
- 听觉智能:通过声音理解世界.pdf
- 分割与理解:区域感知语义注意力用于基于大型语言模型的细粒度图像质量评估.pdf
- SwarmVLM:由 VLM 引导的阻抗控制实现异构机器人在动态仓库中的自主导航.pdf
- 黑色素瘤生长的有限元三维模型及在 6GHz 下黑色素瘤介电特性的时间依赖背散射数据.pdf
- 解剖结构感知的低剂量 CT 去噪通过预训练视觉模型和语义引导对比学习.pdf
- SASST: 利用语法感知切分和大语言模型进行同步语音翻译.pdf
- 一个实验性的水库增强基础模型:6G O-RAN 案例研究.pdf
- Dream4D:将摄像头控制的 I2V 提升至时空一致的 4D 生成.pdf
- UniSVG:用于多模态大语言模型理解与生成矢量图形的统一数据集.pdf
- 专业Latex文档翻译 + 关注
-
实名认证服务提供商
专业Latex文档翻译,完整保持文档排版,完美处理文档中的数学公式和图表等元素,并提供 arXiv Latex 论文中文翻译。
文档评论(0)