- 2
- 0
- 约1.75万字
- 约 12页
- 2026-02-27 发布于北京
- 举报
使用基于图的知识对视觉语言模型进行微调以实现可
解释的医学影像分析
ChenjunLi,LaurinLux,AlexanderH.Berger,MartinJ.Menten,
MertR.Sabuncu,andJohannesC.Paetzold
SchoolofElectricalandComputerEngineering,CornellUniversity,Ithaca,NY
14853,USA
SchoolofComputation,InformationandTechnology,TechnicalUniversityof
Munich,80333Munich,Germany
CornellTech,NewYork,NY10044,USA
本WeillCornellMedicine,NewYork,NY10021,USA
译cl2733@;jpaetzold@
中
2
v摘要准确的糖尿病视网膜病变(DR)分期对于指导及时干预和预防视力
8丧失至关重要。然而,目前的分期模型几乎不可解释,并且大多数公共数据
0
8集除了图像级别标签外不包含任何临床推理或解释。本文提出了一种将图
9表示学习与视觉语言模型(VLMs)相结合的新方法,以提供可解释的DR
0.诊断。我们的方法利用光学相干断层扫描血管成像(OCTA)图像,通过构
3建生物信息图来编码关键视网膜血管特征,如血管形态和空间连接性。然
0
5后,一个图神经网络(GNN)执行DR分期,同时集成梯度突出显示驱动
2分类决策的关键节点、边及其个体特征。我们收集这种基于图的知识,将
:
v模型的预测归因于生理结构及其特性。然后我们将这种推理转化为VLMs
i
x的文字描述。通过这些文字描述和对应的图像进行指令微调训练一个学生
r视觉语言模型。最终代理仅根据单个图像输入就能分类疾病并以人类可解
a
释的方式说明其决策。实验评估在专有和公共数据集上表明,我们的方法
不仅提高了分类准确性,还提供了更具临床解释性的结果。专家研究进一
步证明,我们的代理提供更准确的诊断解释,并能够在OCTA图像中准确
定位病变位置。
Keywords:视觉语言模型·图学习·DR·OCTA.
1介绍
糖尿病性视网膜病变(DR)仍然是视力丧失的主要原因之一,其早期
检测和分期可以显著降低失明的风险[10]。早期研究表明,在彩色眼底图像
2C.Lietal.
上使用深度学
您可能关注的文档
- 深度学习代理训练以避免行为表现得像鹰和鸽子.pdf
- 个体差异在当前计算图像美学方法中的作用- 补充材料.pdf
- 单提示词与双提示词对话生成在人力资源职位面试中的应用.pdf
- 多模态驾驶员注意力融合提升端到端自动驾驶能力.pdf
- 使用 CONFORMER 和 CTC 算法通过六轴加速度计进行无声语音句子识别.pdf
- 贝叶斯定律从图灵集成 和整数划分.pdf
- 大规模自监督语音表示中说话人特定属性的探测分析.pdf
- IV-TUNING:参数高效迁移学习用于红外可见光任务.pdf
- CushionCatch: 移动操作器的柔顺捕捉机制通过结合优化和学习实现的.pdf
- 开放词汇部件抓取.pdf
- 宣贯培训(2026年)《NYT 4512-2025 非洲菊疫病抗性鉴定技术规程》.pptx
- 宣贯培训(2026年)《NYT 4514-2025木薯副产物综合利用导则》.pptx
- 宣贯培训(2026年)《NYT 4513-2025木薯全程机械化生产技术规范》.pptx
- 宣贯培训(2026年)《NYT 4470-2025全株玉米青贮质量分级》.pptx
- 宣贯培训(2026年)《NYT 4468-2025玉米供需平衡表编制规范》.pptx
- 宣贯培训(2026年)《NYT 4469-2025全株玉米青贮质量评定 综合指数法》.pptx
- 宣贯培训(2026年)《NYT 4474-2025东北地区玉米-大豆轮作生产技术规程》.pptx
- 宣贯培训(2026年)《NYT 4472-2025玉米耐盐碱鉴定评价技术规程》.pptx
- 宣贯培训(2026年)《NYT 4473-2025玉米抗旱性鉴定评价技术规程》.pptx
- 宣贯培训(2026年)《NYT 4478-2025甘薯收获技术规程》.pptx
原创力文档

文档评论(0)