2026《图像描述相关技术概述》3800字.docxVIP

  • 0
  • 0
  • 约4.7千字
  • 约 7页
  • 2026-03-23 发布于湖北
  • 举报

2026《图像描述相关技术概述》3800字.docx

-PAGEI-

图像描述相关技术概述

目录

TOC\o1-3\h\u2912图像描述相关技术概述 1

182031.1卷积神经网络 1

254621.2循环神经网络 2

297481.3Encoder-Decoder结构 4

213031.4数据增强 5

313361.5跨语言图像描述 6

本章将详细介绍本文完成图像描述任务使用的相关基础技术。图像文本描述任务主要分为图像理解和生成描述两个部分,在图像理解阶段使用卷积神经网络提取图像特征,在文本生成阶段使用循环神经网络预测词组。深度学习的推广和使用,端到端的思想也被应用在图像描述的任务上,此外,本章还将介绍关于数据增强的方法。

卷积神经网络

深度学习的研究成果大多都来源于人类对大脑认知的研究,人们根据人脑分层逐级抽象的特点构建了卷积神经网络。卷积神经网络(ConvolutionalNeuralNetworks,CNN)作为深度学习的典型网络结构之一,是一种具有卷积计算和深度结构的前向神经网络[28]。目前大量研究任务都采用卷积神经网络。卷积神经网络创造性的提出了局部感受野,这一新概念被广泛用于计算机视觉任务,相比于全连接网络,卷积神经网络权值共享的机制可以大大减少参数量,是训练更快捷。

卷积层:卷积层是CNN的核心层,每一个卷积层都包含有许多卷积核,用来局部连接

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档