- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
多模态图像检索技术的研究
多模态图像检索技术的研究
摘要:随着人类社会的不断进步和信息技术的发展,对智能化设备和技术需求越来越高,为了让计算机更好的理解世界,诞生了计算机视觉这门科学。目前计算机视觉已经遍及生活各个方面,并且在日常生活、医学应用、工业检测等领域中发挥重要的作用。图像纹理是人类观察物体获取的重要信息之一,也是最有感知意义的主要特征。在计算机视觉技术的应用中,图像分析、物体识别等应用都和匹配密切相关。此研究从图像的纹理特征为切入点,研究多模态图像检索技术,讨论纹理特征抽象与图像查询的匹配方法,对跨媒体图像检索技术具有借鉴和指导意义。
中国论文网 /8/view-7219552.htm
关键词:多模态;检索;图像特征
0 引言
现阶段基于图像检索普遍采用方式是人工对上传到网络中的数字图像进行文字标注,根据每幅图像的视觉特征人为的设置他们的文字描述。在检索时,使用标注的文字作为关键字来检索我们想要的数字图像。这种依据图像标注的文字匹配检索的方法简称为“字找图”,它的缺点为:(1)由于需要大量的人工对每幅图像进行文字标注,数字图像的数量是海量的,标注工作是非常耗费人力和时间;(2)由于每个人对图像的认识不同,所以,在标注的过程中会按照自己对图像的认识来选择标注文字,这样会使不同的人对图像的标注不同,而在检索中会产生很大误差;(3)不同国家使用的标注文字不同,所以在匹配文字时也会产生很大的偏差;(4)有的图像里面含有大量的内容,不可能用几个关键字就能表达清楚。为解决标注图像检索的缺陷问题。学者着手开展对内容的图像检索技术的研究。基于多模态的图像检索的改善了此类瓶颈问题,主要从被检图像库根据海量图像特征进行检测和匹配,获取图像之间的相关性特征信息。
1 基于多模态的图像特征匹配方法
(1)直接从图像中寻找匹配线索,而不是通过人为的文字标注,正因为这个特点,突破了传统的关键字标注的耗费人力时间的缺点,而是直接对图像本身进行处理和分析,使检索更贴近图像本身。
(2)检索可以是人机交互的,当使用一种特征选取方式检索的结果不能满足人们的需求时,人们可以人工的改变特征选取方式使检索结果向于人们需求的方向接近。这样避免了计算机检索图像时的不灵活性,加入了人为的因素。因此,人和计算机结合检索能使效率和准确率更高。
(3)基于内容的图像检索是一种相似性检索,可以将检索结果进行相似性排序,我们可以采取逐步求精的算法,不断减小检索的范围,直到定位到准确目标,这与传统数据库精确匹配有很大的不同。
由于这些方法,基于多模态内容的图像检索渐渐成为人们研究的重点,此类技术可以应用在社会安全、遥感、医学、数字图书馆、建筑、计算机辅助设计、地理信息系统、商标版权管理、等诸多领域。
2 基于纹理识别的多模态的图像检索系统的框架和技术
基于纹理识别的多模态图像检索系统组成部分如图1所示。
(1)输入模块:分析和获取图像的纹理特征值,并将特征向量输入图像特征数据库。
(2)描述模块:利用查询抽象检索技术,实现将用户需求抽象提取相关图像特征语义,并完整描述成计算机能进行识别的特征向量。
(3)检索模块:与图像数据库的图像纹理特征值进行相关性匹配,根据机器学习和神经网络技术,对跨语义的特征向量进行学习和筛选,获取最符合查询要求的图像信息,并返回给用户。
3 基于图像纹理特征的检测方法
图像有三大底层特征,分别是颜色特征、纹理特征和形状特征。纹理特征是显著的视觉特征,其弱化了颜色和亮度的作用,但它吸收了表面结构的排列与组织次序,而且表现出了上下文的关系,反映出了同质再现的视觉特征。
纹理源于人们对物体表面触感的概念,这种固有的内在特征反映了物体表面的组织结构或者上下文内容的关系等诸多有用的信息,或者反映了图像像素间的灰度变化情况或者颜色变化情况。组成纹理的基本元素叫作纹元或者纹理基元,是一个触发视觉感知并且特性相对稳定的基本单元,这些单元在一定的区域内的不同位置会以不同的形态再现,主要是灰度或色彩模式呈现不同特点,其包含多个像素,在物体表面呈现三种:周期性、准周期性或随机性。
如今,神经网络、最近邻分类器、决策树和支持向量机等模式方法已经广泛的应用到了许多领域,譬如图像分类、视频处理、检索等。模式类就是由一些共同属性所决定的,模式分类就是根据对象的特征或属性进行分类。
按照学习方法的监督程度,也就是根据否存在先验知识并且是否使用到这些先验知识,模式分类方法可以分为监督分类和非监督分类。
监督分类对各对象分类的依据是通过训练样本,选择合适的特征参数,以此建立判别函数。监督分类必须要有分类区域的先验类别知识用以建立判别函数,从而获得训练分类器,它把图像分解为多个组成部分,求解各部分
您可能关注的文档
最近下载
- 一种新型功交换式能量回收装置.pdf VIP
- 生猪屠宰兽医卫生检疫人员考试题库答案.pdf VIP
- 生猪屠宰兽医卫生检疫人员考试题及答案.doc VIP
- 《仲景食品公司应收账款管理现状、问题及对策》6000字.doc VIP
- 2024《仲景食品公司应收账款精益化管理研究》9100字.docx VIP
- 2024《调味配料企业应收账款管理问题及对策—以仲景食品公司为例8600字》.docx VIP
- 2024《企业应收账款管理的现状分析—以仲景食品公司为例》8400字.doc VIP
- 生猪屠宰兽医卫生检验人员理论考试题库及答案.pdf VIP
- 仲景食品有限公司应收账款风险分析与防范.docx VIP
- 仲景食品有限公司应收账款风险分析与防范.docx VIP
文档评论(0)