- 1
- 0
- 约2.47万字
- 约 16页
- 2023-07-05 发布于四川
- 举报
本发明公开了一种多模态特征融合的视频描述文本生成方法,步骤包括:1)建立数据集、验证集及语义词典;2)构建多模态特征融合网络,获得聚合特征;3)利用语法感知视频动作的编码器获得描述语句的主语、谓语和宾语;4)利用动作指导解码器,生成视频的描述文本;5)训练视频文本生成网络模型;6)生成视频的文本描述语句,经过步骤1至步骤5完成网络训练之后,获得视频文本生成网络模型的所有参数,这时,将待描述视频作为输入视频,进行步骤2至步骤4之后,获得待描述视频的文本描述。本发明方法,具有更高的准确性。
(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 CN 113806587 A
(43)申请公布日 2021.12.17
(21)申请号 202110975443.2 G06N 3/08 (2006.01)
(22)申请日 20
您可能关注的文档
最近下载
- Fuji富士-人机界面HMI操作说明书-MONITOUCH V8系列 参考手册.pdf
- 第三单元 第01课时 认识多边形及长方形、正方形的特点(教学设计)数学人教版三年级下册2026.docx
- 2023年卫生公共基础知识.doc VIP
- 第1课时 认识多边形及长方形、正方形的特点 教学设计 2026人教版数学三年级下册.pdf
- 【不详】品类创新:成为第一的终极战略.pptx
- 人教版四年级数学下册第一单元测试卷(2套)(附答案).pdf VIP
- 2025瑞派宠物医院管理股份有限公司招股说明书.pdf VIP
- 调蓄池清淤专项施工方案.docx VIP
- 《广西壮族自治区建设工程费用定额》2016年.pdf
- 《洁净室施工及验收规范》(GB50591-2010).pdf VIP
原创力文档

文档评论(0)