- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
碍 { 茜 /
文章编号:1007—1423(2015)02—0015—03 OOI:10.39690.issn.1007—1423.2015.02.004
一 种基于随机游走模型的融合视觉单词共现性的软分配词袋技术
张晋
(四川大学计算机学 院,成都 610065)
摘要 :
提取局部兴趣点并通过词袋技术表征图片.是进行图片检索的一种经典方案。在传统的词袋技术中,每一个局部兴趣
点的分配都是相互独立的.而没有考虑相邻局部兴趣点分配的相互影响。这样可能会导致某些局部兴趣点不可靠的
分配,从而降低图片检索的精确度 。通过统计视觉单词的共现性 .可以学习到一些有价值的先验知识;同时利用随机
游走模型.将视觉单词的共现性融合到传统的软分配词袋技术中,从整体上减少局部兴趣点不可靠的分配 ,进而提升
图片检索的精确度
关键词 :
局部兴趣点;视觉单词;词袋技术;共现性;随机游走模型
0 引言 1 统计视觉单词之间的共现性
如何高效准确地实现 以图搜 图,是近年来学术界 1.1什么是视觉单词的共现性
和工业界的一个热点研究问问题 一个经典的技术方 在讨论具体融合方法之前.我们会详细说明什么
案是 :使用 SIFF算子提取并描述 图片 中的局部兴趣 是视觉单词之间的共现性.以及如何统计视觉单词之
点.通过聚类算法学习一个包含一定数量视觉单词的 间的共现性
词典.计算图片中局部兴趣点在该词典上的词频分布. 在文本 中.“中华”“人民”以及 “共和国”3个词频
用于表征该图片。其中,词频分布的计算就涉及到软分 繁出现。我们相信 ,如果文本中当前的2个单词依次是
配词袋技术 ,其大致思想如下:一个局部兴趣点分配给 “中华”和 “人民”.那么下一个词是 “共和国”的概率一
词典中和该局部兴趣点距离最近的K个单词.而不仅 定远大于是 “蛋糕 ”或 “屏幕 ”的概率 视觉单词之间同
仅是分配给和该点距离最近的 1个单词.这样可以减 样存在类似的共现性规律 在字典学习过程中.训练集
少分配中可能存在的误差 中每一个局部兴趣点都会被标记为某个视觉单词:如
在传统的软分配词袋技术中.相邻局部兴趣点的 果在单词 a一定范围内.单词b频繁地出现.那么单词
分配是相互独立的.而没有考虑相邻局部兴趣点分配 a和单词b就具有 比较高的共现性:反之同理
结果的相互影响 .可能会导致不可靠的分配进而降低 1.2 统计视觉单词之间的共现性
检索模型的精确度。事实上 .词典中单词之间往往存在 给定一个训练图片集.我们使用 SIFT算子提取并
一 些统计规律,如两个单词共同出现的频率 本文利用 描述图片中的局部兴趣点 .这样就得到了一个规模庞
随机游走模型.通过考虑相邻局部兴趣点的分配结果 大的局部兴趣点集合 我们使用K—means算法对该集
的相互影响.将上述统计规律融合到传统的软分配方 合进行聚类.形成了K个单词的视觉词典。这样训练集
案中去 ,借以减少不可靠的分配进而提升图片检索的 中每一张图片的每一个局部兴趣点就可 以被标记为某
精确度 个视觉单词。我们这样定义2个视觉单词共同出现:对
于某个单词 a.如果单词b出现在 以a为圆心以某个阈
现代计算机 2015.01中@
文档评论(0)