- 2
- 0
- 约4.08千字
- 约 8页
- 2017-01-05 发布于北京
- 举报
《关于静态图像生成句子描述的问题
关于静态图像生成句子描述的问题
进入Computer Vision领域以来,很久之前就有个想法,能否给计算机一幅照片,计算机能够自动的描述图像中的内容,甚至图像中的人物以及正在发生的事情。就像是咱们小时候的看图作文似的。
但是现在已经有文章开始做相关工作了,下面分别描述一下。
第一篇是CMU的小牛Abhinav Gupta同学的CVPR2009的Oral,其实做的视频里的东西。
Understanding Videos, Constructing Plots – Learning a Visually Grounded Storyline Model from Annotated Videos
Abhinav Gupta, Praveen Srinivasan, Jianbo Shi and Larry S. DavisIn CVPR 2009 (Oral) (PPT)
这篇文章是通过AND-OR的图模型来叙述视频里面正在发生的运动的各个动作,包括击球、接球、扔球等。因为视频里面含有更多的信息,所以做起来也相对容易一下。
————–
第二篇是UIUC的Ali Farhadi写的,发在ECCV2010的poster。
Every Picture Tells a Story: Generating Sentences for ImagesAli Farhadi, Mohsen He
您可能关注的文档
最近下载
- 2026年交通运输部所属事业单位招聘(124人)笔试模拟试题及答案解析.docx VIP
- UI设计(拓展) UI界面设计的常用方法 ui界面设计2-UI设计的常用方法.ppt VIP
- 基于单片机的智能鱼缸设计.docx VIP
- 信阳职业技术学院单招《数学》真题【综合卷】附答案详解.docx VIP
- 2026年雨城区社区工作者招聘考试模拟试题及答案解析.docx VIP
- 广西三支一扶面试真题(含参考答案).docx VIP
- 2025四川雅安市雨城区考试招聘社区工作者39人备考题库最新.docx VIP
- 光储柴项目初步技术方案.pdf VIP
- 福建省市县(市区)中学学生学籍卡片(一).doc VIP
- 七年级数学上册数学 2.3 数轴(七大题型)(解析版).pdf VIP
原创力文档

文档评论(0)