语义图像检索中人工智能应用.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
语义图像检索中人工智能应用

语义图像检索中人工智能应用   [摘要]根据语义特征进行图像检索是图像检索技术的发展趋势,提出一种利用人工智能以实现图像语义特征提取的方法,即通过模糊逻辑、遗传算法和人工神经网络三者的融合来解决图像语义特征提取这一难题。   [关键词]人工智能 图像语义检索 人工神经网络 遗传算法模糊逻辑   中图分类号:TP3文献标识码:A 文章编号:1671-7597 (2008) 0220006-01      语义图像检索是一种在互联网上进行图像检索的新方法,它是根据图像的逻辑特征和抽象属性进行检索,使计算机检索图像的能力接近人的理解水平的检索技术,但如何来提取语义特征,目前还处于研究和探索阶段,所以本文利用人工智能方法来解决图像检索的语义特征提取的问题。   根据模糊逻辑、遗传算法和人工神经网络的特点:人工神经网络具有学习、联想、容错等能力,擅长于直接从数据中进行学习;模糊系统具有较强的推理能力,擅长于描述和利用学科领域的知识;遗传算法具有自组织、自适应和自学习等智能特性,擅长于求解全局最优问题。本文将三者融合在一起,用以进行语义图像检索中语义特征的提取。      一、利用遗传算法进行图像的分割,以便有效地获取图像的语义信息      图像分割是从背景中将感兴趣的目标分割出来,将各像素分类,分类所依据的特性可以是像素的灰度值、目标的面积、速度、颜色及空间,纹理特性等,这里可以利用多特征参数编码基因串进行优化分割。在遗传算法中,染色体的长度是根据所解决问题的需要定的,并根据每个子串所代表的意义作相应的解码,从而通过遗传算法找到全局最优值。      (一)建立由字符串组成的初始群体   图像分割中,设定人口数为2O,繁衍代数为4O,由于分割电平的灰度值在0~255之间,可把每个染色体成员编码为8位0,l符号的二进制串,它代表某个门限值。这些门限的初始值是随机的,相应的适应度也各有高低。紧接着遗传算法对染色体解码,并求其适应度值。由适应度值进行染色体优胜劣汰的选择,被选中的染色体作为父代。经过不断进化,到最后一代,染色体已基本收敛,其适应度也达到最佳值,这时就得到了最佳门限。      (二)适应度函数的设计   适应度函数相当于现实世界中生物进化的环境。环境的好坏直接影响到生物进化的结果。这里我们采用otsu 法进行图像分割时的适应度函数公式:f=w0(u0-v)2+w1(u1-v)2,其中w0和w1分别表示其灰度值小于门限k和大于门限k的概率和;u0和u1分别表示上面2个区间的平均灰度值;v表示整幅图像的平均灰度。f的值越大,则表示分割的质量越好。      (三)根据遗传概率,利用下述操作产生新群体   这里包括3个操作器。即复制,单点交叉互换和位变异。其中操作器的参数设置为交叉互换率0.65,位变异率为0.008,而操作数的负载,即人口数设为20。交叉互换是用下述方式重新组合两个父体以形成两个子体。它允许有利的新特征迅速组合。互换操作是按一定概率进行的,互换率越大,互换操作的可能性也就越大。      二、利用模拟系统和神经网络的融合来使图像的语义进行自动标注      一般说来,用户在检索一幅图像时,比较关心的是图像的语义特征。其训练方法是基于预先给定的评价函数的极小化,其本质也是用形式和数目预先确定的多个函数(即隐层单元的输出函数)的组合去逼近建立样本和其类别的映射。用经过上节利用遗传算法分割出的样本为初始样本,然后用样本数据本身来逼近它在空间的分布状况,并以此为依据来构造神经网络。用其神经元覆盖区域的组合近似“勾勒”出各类样本的几何区域。而当判断一个新的样本属于哪一类时,只需分别计算该样本对各几何区域的隶属度,隶属度大的区域对应的类别就是答案。   我们引入关键词来描述一幅图像的意义,而同一幅图像可以用许多意义相近的关键词来描述,这给关键词匹配和管理都带来了困难。为此,用两个层次上的关键词来描述一幅图像。首先,用图像的分类信息来表示它的第一层语义,对于系统中某些语义不明确的图像,可以将其分为很多类,并用多个关键词来描述第一层语义。第一层所用到的关键词可以采用一些大家广为接受的分类目录,这样可以限制该层分类词的数目。在语义描述的第二层,用户就可以用各式各样的关键词对该图像加以描述。采取这样的策略在一定程度上克服了由同义词以及其它原因造成的关键词的多样性。      (一)为了获得图像的语义信息,根据用户的反馈来修改图像对应的关键词及其权重   其过程为:   (1)系统初始时,将每幅图像所关联的关键词的权重都设置为“1”,表明与该图相关的所有关键词的重要性都一样。   (2)每次用户查询和反馈后,收集好用户给出的查询关键词和正负反馈图像。   (3)对于每个用户

文档评论(0)

151****1926 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档