在线图片标题生成系统.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
在线图片标题生成系统 摘 要:近年来,伴随着计算机科学技术和信息科学技术的快速发展,互联网发展进入了大数据时代。而在大数据时代中,数据的价值也变得越来越高。如何从大量无效数据中提取出有效数据变成了一个重要的任务。而对数据进行筛选的一个重要任务就是对数据进行预处理,即如何有效地对数据进行标注。因为对数据进行标注是管理和使用数据的一个重要前提。而在大量的数据中,图像数据是其中占比很大又处理较为困难的一类数据。本文的图片标题生成技术就是图像标注的另一种称呼。图片标题生成技术不仅能帮助人们管理无标记的图片,还能帮助有理解障碍的人理解图片的内容。 本次毕业设计利用谷歌基于tensorflow的图片标题生成的开源程序,设计了一个基于Python程序的web网站,通过这个网站将如今已经拥有良好图片标题生成效果的图片标题生成技术展现出来,让更多人了解使用到这个技术。同时,这个网站可以帮助收集人工资料,为完善这项技术提供更多的参考。 关键词:图片标题生成系统;Python;html;django;tensorflow; 前 言 伴随着机器翻译和大数据的兴起,出现了图片标题生成技术的研究浪潮。使用较为准确的语句自动描述图像的内容是一项非常具有挑战性的任务,但是这项任务却可能有着巨大的影响和非常广泛的应用场所。例如,在幼儿教育领域可以帮助小孩子看图识字;在医疗生活领域可以帮助视觉障碍人士更好的理解图像的内容;在图像检索方面可以帮助标记出图像描述的内容方便检索。比起已经经过深入研究的图像分类或目标识别任务,这项任务显得更加困难,因此它也是目前是计算机视觉领域的主要焦点。 本次毕业设计就是围绕这个诞生还没有多久在线图片标题生成技术,设计一个在线图片标题生成的相关网站。 在本文中,我们首先大概的介绍了这个技术的背景和发展以及我们要设计的是一个怎样的网站。接着我们详细介绍了图片标题生成的相关算法和模型。然后,我们又对设计这样一个网站所需要的技术进行了具体的描述和对比,找到用于本次毕业设计的合适技术。然后再对具体构造网站进行了可行性和需求分析,并作出概要设计。之后,利用这些技术将网站的具体实施代码和相关功能和显示效果进行介绍。最后再总结本次毕业设计,对进一步开发进行展望。 第一章 绪 论 本章首先重点介绍了图片标题生成技术的背景及其重大意义,接着介绍了在线图片标题生成系统的一些模块以及其功能,然后介绍了建立本系统所需要做的主要工作和本系统的一些创新点,最后介绍了目前图片标题生成技术存在的一些问题。 1.1 研究背景 伴随着机器翻译和大数据的兴起,出现了图片标题生成技术的研究浪潮。使用较为准确的语句自动描述图像的内容是一项非常具有挑战性的任务,但是这项任务却可能有着巨大的影响和非常广泛的应用场所。例如,在幼儿教育领域可以帮助小孩子看图识字;在医疗生活领域可以帮助视觉障碍人士更好的理解图像的内容;在图像检索方面可以帮助标记出图像描述的内容方便检索。比起已经经过深入研究的图像分类或目标识别任务,这项任务显得更加困难,因此它也是目前是计算机视觉领域的主要焦点。 近些年来的许多研究工作都取得了巨大的发展,比如计算机视觉和自然语言的深层模型、图像-句子检索、为图像生成最新的句子描述。在这些发展的方法中,大多将图片标题生成看做检索任务。他们为句子和图像提取特征,然后将这些特征相互映射,存入到语义嵌入空间中。这些方法对给定的图像进行检索获得其映射的句子,或是对给定的句子进行检索已获得它所映射的图像。但是,这样的方法存在着很大的缺陷,即他们都只能用于查询图像标注数据集中已经存在的图像的句子描述。而在实际工作中,我们所遇到的更多情况都是对没有存入的图像、场景进行的处理。而卷积神经网络和循环神经网络相结合的模型,恰好可以较好的处理这种情况。 1.2 国内外的研究的发展 将卷积神经网络和循环神经网络结合的模型用于解决图像标题生成的问题的研究最早是从2014开始提出,在2015年开始对模型各部分组成上进行更多尝试与优化,到2016年的国际计算机视觉与模式识别会议上成为了一个热门的专题。在这个发展过程中,将卷积神经网络和循环神经网络结合的核心思路并没有发生变化,变化的是使用了更好更复杂的卷积神经网络模型,效果更好的长短期记忆网络模型,图像特征输入到循环神经网络中的方式,以及更复合的特征输入等。 2014年10月,百度研究院的Junhua Mao和Wei Xu等人提出了多模态循环神经网络模型,创造性地将深度卷积神经网络和深度循环神经网络结合起来用于解决图像标题生成和图像语句检索的相关问题。这也应该是第一个采用多模态循环神经网络架构的神经网络模型。 201

文档评论(0)

潇湘画里 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档