基于多模态对比解码的视觉语言模型幻觉减轻方法研究.docx

基于多模态对比解码的视觉语言模型幻觉减轻方法研究.docx

毕业设计(论文)

PAGE

1-

毕业设计(论文)报告

题目:

基于多模态对比解码的视觉语言模型幻觉减轻方法研究

学号:

姓名:

学院:

专业:

指导教师:

起止日期:

基于多模态对比解码的视觉语言模型幻觉减轻方法研究

摘要:随着视觉语言模型(VLM)在图像描述生成、图像-文本检索等领域的广泛应用,其幻觉问题逐渐成为研究热点。本文针对VLM幻觉问题,提出了一种基于多模态对比解码的幻觉减轻方法。首先,构建了一个多模态对比解码器,通过对比视觉特征和语言特征,实现视觉-语言模态之间的信息交互。其次,设计了一种幻觉检测机制,能够有效识别VLM生成的幻

文档评论(0)

1亿VIP精品文档

相关文档