- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于移动中心点图像检索相关反馈技术
基于移动中心点图像检索相关反馈技术
摘要:为了解决图像检索中的语义鸿沟问题,本文提出了基于移动中心点的图像检索相关反馈方法,通过人与计算机的交互,获取人对图像的理解,并不断的调整图像特征的权值以及相似度量中的参数,最终得到与用户需求相吻合的结果。实验证明此法可以有效提高语义分类的准确性。
关键字:图像检索;相关反馈;移动中心点
引言
当前基于底层特征的图像检索已经有了很大的进展,但是由计算机完全自动的理解图像仍然存在很多问题。图像检索过程中的底层特征表达和高层语义之间存在着语义鸿沟的问题。主要表现在:人类和计算机对图像的理解表达方式不同;底层特征与高层语义无绝对对应关系;人类感知具有主观性[1]。于是人们提出了相关反馈方法以解决图像检索中的语义鸿沟问题,因此,如何通过人的理解来逐步精确图像的语义是相关反馈技术所要解决的主要问题。
1 相关反馈的基本原理
相关反馈方法是基于语义的图像检索中的一项重要的技术。图像检索中的相关反馈具体过程如下:
用户向系统输入查询关键字,示例图或草图;系统对图像数据库进行检索,返回初始结果;用户判断当前显示的检索结果是否满足自己的查询要求,若满足要求,则查询结束,否则转入第4步;用户对系统检索的结果作出反馈,将反馈结果输入到系统,系统根据用户的反馈调整输出结果,并转到第3步。不断重复以上步骤,最终得到更为精确的结果。
基于相关反馈的图像检索系统的基本框架由4部分组成[2]:用户接口部分,特征提取部分,特征匹配部分,相关反馈部分。用户通过接口部分输入查询示例图或者关键字。如果输入的是关键字,则将关键字与语义库中的语义进行比较,得到相应的结果;如果输入的是示例图,则提取示例图的特征,并与特征数据库进行匹配,得到相应结果。系统将结果输出到用户接口之后,用户再对系统产生的结果进行反馈,使系统得到更加精确的结果。
基于相关反馈的图像检索系统的基本框架如图1所示。
2 移动查询点
查询点移动(Query Point Movement)的原理是根据用户反馈信息来调整查询点,使之更加接近理想的查询点,远离不好的查询点,然后用调整后的查询点重新计算检索结果[3]。
在检索过程中,查询点都可以表示为特征空间中的向量。在用户进行查询时,特征空间中会有一个最符合用户标准的查询点,能够准确地表达他的信息需求,这个点称为理想查询点。但是在实际的检索过程中,用户实际输入的查询点,即输入的关键字或示例图像,往往与理想查询点有一定偏差。通过将查询点向理想的查询点移动,来逐渐减小此偏差。
对于用户提交的正反馈集合RP和负反馈集合RN,使用Rocchio公式:
其中Qi和Qi+1分别对应查询迭代中第i次和第i+1i+1次的查询点位置;?琢、?茁和?酌分别为常量,DPi和DNi分别为RP和RN中的反馈图像,NP和NN分别为RP和RN中的反馈图像个数。通过这种反馈方法,系统就可以逐渐调整查询点,从而使结果更加准确。目前已有很多系统使用这种相关反馈方法。
3 基于移动中心点的相关反馈方法
目前,网络中对图像的使用较广泛的领域之一是网络相册。然而,网络相册的照片名称多由数码相机自动标注的字母和数字序列组成,即无标注或者标注不完整。这就给检索带来了不便。
在将相关反馈技术应用到这一领域时会遇到新的问题。首先,在用户输入检索关键字或示例图,系统也返回结果之后,用户往往只对正确的结果感兴趣。当用户看到自己感兴趣的图片之后,便点击浏览或者下载,而对于错误的结果往往对其忽略。也就是说,用户通常只做正反馈而不做负反馈。其次,用户通常只对少量的查询结果感兴趣。一般不会花大量时间对全部结果逐一进行相关反馈。另外,网络中的用户总是在不断的上传图片或删除图片,因此图像数据库是在不断变化的。
基于以上分析,本文提出一种新的相关反馈方式。首先利用一组已标注过语义的训练样本图像,通过机器学习方法对图像数据库进行分类。找出此类中距离训练样本最近的m幅图像。则此m幅图像就是最能反映此类图像的语义的图像,称之为类的核心集。计算此核心集中的图像的特征在特征空间中的中心点。中心点的计算如下:假设第i个特征向量为[fi1,fi2,...fit](t为特征数量),则此类特征空间的中心点为
对核心集中每幅图像都都赋予一个相同的权值wm,对不属于核心集的图像赋予权值wn(wnwm)。(假设类的中心点是收敛的)当系统输出结果以后,用户给出r幅正相关反馈图像。对于用户给出的这些反馈图像可能有三种情况:
如果反馈图像i在此类的核心集中,则系统不进行任何处理;
如果反馈图像i属于此类,但不在此类的
您可能关注的文档
- 基于社会需求信息管理与信息系统专业人才培养模式研究.doc
- 基于社会需求前提营养与食品卫生学实验教学改革.doc
- 基于社会需求和AHP―QFD电子商务专业本科课程体系设计.doc
- 基于社会需求导向人力资源管理实践教学改革研究.doc
- 基于社会需求应用型本科人才培养策略探究.doc
- 基于社会需求应用心理学课程体系改革初步思考.doc
- 基于社会需求经济学专业研究生实践能力调查分析.doc
- 基于社会需求职业教育设计人才培养模式探析.doc
- 基于社会需求视角下高职院校毕业生就业分析.doc
- 基于社会需求调查JSP课程教学设计研究.doc
- 2025年运城市绛县某国企外包岗位招聘10人笔试备考题库参考答案详解.docx
- 2025年运城市绛县某国企外包岗位招聘10人笔试备考题库及答案详解一套.docx
- 2025年运城市闻喜县某国企外包岗位招聘10人笔试备考题库及参考答案详解一套.docx
- 2025年运城市稷山县某国企外包岗位招聘10人笔试备考题库带答案详解.docx
- 2025年运城市闻喜县某国企外包岗位招聘10人笔试备考题库及答案详解1套.docx
- 2025年运城市闻喜县某国企外包岗位招聘10人笔试备考题库及完整答案详解1套.docx
- 2025年运城市闻喜县某国企外包岗位招聘10人笔试备考题库及参考答案详解1套.docx
- 2025年运城市绛县某国企外包岗位招聘10人笔试备考题库及参考答案详解一套.docx
- 2025年运城市稷山县某国企外包岗位招聘10人笔试备考题库及参考答案详解一套.docx
- 2025年运城市闻喜县某国企外包岗位招聘10人笔试备考题库参考答案详解.docx
文档评论(0)