利用模型选择确定视觉词袋模型中词汇数目.doc

下载文档 降价啦

2
0
约9.02千字
约 3页
2017-09-03 发布于江西
举报
版权申诉
保障服务

利用模型选择确定视觉词袋模型中词汇数目.doc

1、本文档共3页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

利用模型选择确定视觉词袋模型中词汇数目

?图形、图像、模式识别? 利用模型选择确定视觉词袋模型中词汇数目许明，韩军伟，郭雷，尹文杰 XU Ming，HAN Junwei，GUO Lei，YIN Wenjie 西北工业大学自动化学院，西安 710129 School of Automation，Northwestern Polytechnical University，Xi’an 710129，China XU Ming，HAN Junwei，GUO Lei，et al.Determine word number of Visual Bag-of-Words model by model selection method.Computer Engineering and Applications，2011，47（31）：148-150. Abstract： Visual Bag-of-Words model has been widely used in image classification，retrieval and recognition.However，its word number usually is selected by user experience or determined using the supervised cross-validation scheme.In this paper， an unsupervised method is proposed to infer the word number of Visual Bag-of-Words model（BoW） based on the idea of model selection.Firstly，Gaussian Mixture Models（GMM） are built accounting for BoWs with different word number.After- wards，Bayesian Information Criterion（BIC） is adopted to select the best model that has the minimum BIC value.Compared with cross-validation approach using image classification，the result demonstrates the effectiveness of the proposed approach. Key words：Visual Bag-of-Words；model selection；Gaussian Mixture Mode（l GMM）；Bayesian information criterion 摘要：视觉词袋（Visual Bag-of-Words）模型在图像分类、检索和识别等计算机视觉领域有了广泛的应用，但是视觉词袋模型中词汇数目往往是根据经验确定或者采用有监督的交叉学习选取。提出一种确定视觉词袋模型中词汇数目的无监督方法，利用模型选择的思想来解决问题。使用高斯混合模型描述具有不同词汇数目的视觉词袋，计算各模型贝叶斯信息准则的值，选取贝叶斯信息准则最小值对应的词汇数目。与交叉验证的监督学习在图像分类实验的对比结果说明该方法准确有效。关键词：视觉词袋模型；模型选择；高斯混合模型；贝叶斯信息准则 DOI：10.3778/j.issn.1002-8331.2011.31.042 文章编号：1002-8331（2011）31-0148-03 文献标识码：A 中图分类号：TP37 1 引言近年来，随着计算机网络的飞速发展和数字图像获取技术的进步，图像资源正以惊人的速度增长，与图像视觉内容分析相关的应用越来越多。而所有这些应用的基础是图像视觉内容的有效表达。图像视觉内容的表达常常利用图像的底层特征，常见的有基于全局的颜色[1]、纹理[2]、形状[3]等特征，基于局部区域的 SIFT[4]特征。视觉词袋模型[5]是目前最为流行的图像底层特征之一，它的基本原理：借鉴“字典”的思想，提取图像局部特征并进行量化处理，形成“字典”中的一组基本词汇，进而图像可以类似于文本的表示方法即统计基本词汇出现的频数。最近 5 年来，基于视觉词袋模型的图像表示方法被深入地研究并在图像分类、检索和识别等计算机视觉领域有了广泛的应用，其中 Li 等[6]提出的基于贝叶斯方法的从少量样本中无监督学习目标类别，Fergus 等[7]提出的从 Goog