- 1、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。。
- 2、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
- 3、文档侵权举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
BLaVe-CoT:面向视障和低视力用户的具备一致性意识的视觉
问答系统
WanyinCheng1andZanxiRuan2
Abstract—视觉问题回答(VQA)对于辅助视障和低视力
(BLV)用户具有巨大潜力,但实际应用仍然充满挑战。由于视
觉障碍,BLV用户经常拍摄模糊或构图不佳的照片,并且在表
达关于他们无法完全看到的内容的具体问题时遇到困难。因此,
您可能关注的文档
- RecMind:LLM 增强的图神经网络用于个性化消费者推荐.pdf
- UrbanMIMOMap: 一个带有预编码意识地图和基准的射线追踪 MIMO 信道状态信息数据集.pdf
- 理解启用 AQM 的 WiFi 网络中 BBRv3 的性能.pdf
- 智能建筑的二十年历程:一次回顾.pdf
- 基于人工智能的 X 光骨折检测应用创新使用定制 CNN 和迁移学习模型.pdf
- 波束成形-LLM:我错过了什么、在哪里以及何时错过?.pdf
- MCIGLE: 多模态无示例类增量图学习.pdf
- 基于度量嵌入初始化的可解释性差分隐私图聚类.pdf
- MSLEF: 招聘中的多段 LLM 集成微调.pdf
- 利用熵驱动对话策略在任意大型产品目录中建模购物者兴趣广度.pdf
- 专业Latex文档翻译 + 关注
-
实名认证服务提供商
专业Latex文档翻译,完整保持文档排版,完美处理文档中的数学公式和图表等元素,并提供 arXiv Latex 论文中文翻译。
原创力文档


文档评论(0)