世界模型作为多模态桥梁:利用视频预测模型为大语言模型注入物理世界常识.docx

世界模型作为多模态桥梁:利用视频预测模型为大语言模型注入物理世界常识.docx

  1. 1、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。。
  2. 2、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
  3. 3、文档侵权举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

PAGE

PAGE1

《世界模型作为多模态桥梁:利用视频预测模型为大语言模型注入物理世界常识》

课题分析与写作指导

本课题《世界模型作为多模态桥梁:利用视频预测模型为大语言模型注入物理世界常识》旨在探索解决当前大语言模型在具身智能与物理世界交互中存在的“常识缺失”与“幻觉”问题。随着以Transformer和扩散模型为代表的生成式人工智能技术的飞速发展,尤其是以Sora为代表的视频生成模型展现出的惊人物理模拟能力,为构建能够理解、预测并推理物理动态的“世界模型”提供了新的技术路径。本研究的核心在于探讨如何利用视频预测模型作为多模态接口,将视觉序列中蕴含的物理规律(如物体持久性、重力

您可能关注的文档

文档评论(0)

***** + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档