基于稀疏编码图像自动标注.docVIP

下载本文档

5
0
约3.69千字
约 7页
2017-06-10 发布于福建
举报
版权申诉

基于稀疏编码图像自动标注.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于稀疏编码图像自动标注

基于稀疏编码图像自动标注　　摘要对于图像的自动标注，探索合适的方法能提高系统标注结果在语义范畴的正确性。该文探讨了基于稀疏编码的图像自动标注。结合近邻及统计的思想，以corel-5k原有人工标注为基础，在matlab平台上对其测试图集进行自动标注。从结果上看，稀疏编码方法准确率相比常用方法偏低，但对于图像特征的学习明显优于其他方法。因此，稀疏编码在图像的自动标注领域有可行之处【关键词】稀疏编码图像自动标注近邻求解 1 引言图像自动标注是通过获得已经标注好的图像集，对未标注过的图像进行标注。近年来，对图像自动标注的研究增多，使准确率逐渐提高。图像自动标注使用最广泛的是基于学习方法的分类模型，例如判别式模型、生成模型等。此外，还有一种基于最近邻的分类模型。因为最近邻的标注方法使用的视觉特征不能很好的反映语义信息，所以应用并不普遍。但在视觉特征的提取和近邻图像求解方法进行改进，就可以提高近邻模型的标注性能。基于稀疏编码的图像自动标注就是一种基于最近邻的分类模型 2 最近邻方法论证 2.1 图像特征提取最常用的图像特征是颜色特征，除此之外还有纹理特征、形状特征、空间特征等特征。一般特征的提取有很多方式。颜色特征、sift特征、freak特征、brisk特征等等。因为颜色空间的HSV特征结果便于后续的视觉分析且计算量小，本文只考虑图像颜色特征的提取 2.2 最近邻求解最近邻图像求解是图像自动标注最重要的部分，其核心是通过对提取的图像特征运算得到与其最相似的图像。最近邻图像求解算法很多，本文只在最常用的欧式距离和最终使用的稀疏编码之间展开讨论 2.2.1 欧式距离算法欧式距离算法很早就在图像边缘检测、人脸识别、数据审计等不同方向有着广泛的应用。对于相似性度量，欧式距离是一个简单实用的算法。在寻找相似的图像中，为了提高准确性，提取的图像特征不一定只有颜色特征一种。但考虑到不同特征的影响不同，这里引进一种加权的欧式距离算法： 2.2.2 稀疏编码算法稀疏编码源自于神经网络，是近年来图像信号处理领域的一个研究热点。其最大的优势是压缩数据量，给在高纬度数据的计算带来极大便利。例如两个上万纬的向量空间，一个作为训练空间一个作为测试空间。两个空间做一个简单的内积可能达上万次。但如果这两个向量空间里有n个和m个非零元素，那么只用做min（n，m）次乘法。并且当m，n远大于零元素的个数时，计算量就会大大减少。但并不是min（n，m）越小越好，对于训练空间，若n的值远远小于空间纬度值，即数据点个数远小于特征数量，并且这时候还没有任何约束，便会出现过拟合的情况。过拟合不是没能拟合好训练数据，相反，过拟合的代价反而与零非常相近，这样则会导致训练结果没法泛化到测试样本空间中去。要是因为特征过多发生了过拟合，减少不必要的特征量便能减少过拟合。但很多时候，其特征不仅庞大还没有冗余，所以一般都用正则化在保留所有特征变量的情况下减少其数量级。正则化可以通过坐标下降法和范数求解等方法实现。这些方法，最常用的l1范数正则化。l1范数是从凸优化角度计算训练空间的稀疏系数，是l0范数的最优凸近似，又比l2更具有稀疏性。因此，本文采用l1正则最小二乘法求解测试目标与训练空间对应的稀疏系数式中y为测试图像特征，A是所有训练图像特征构成的矩阵，x为稀疏的基向量。λ∑xi是正则化项，λ是正则化参数。正则化项能对高阶项进行收缩，通过在很好的拟合数据和保持参数值较小之间找到平衡。λ越大拟合的结果越简洁，若过大，则拟合的结果将会趋近一条水平线，此时为欠拟合综上所述，欧式距离算法虽然相对简单，但其图像所有特征点同等对待，这大大减少了图像之间的关联性同时也失去部分图像信息。而稀疏编码算法不仅能考虑图像的关联性和差异性，同时也是一种鲁棒性很强的算法。因此，本文最终使用稀疏编码方法在图像的hsv颜色特征上对图像进行自动标注 3 实验思路 Corel-5k数据集图像集共包含大小相等的5000张图片。Corel-5k分为50个大类，每一类都是100张图，且每一类都有相应主题。其中每张图片已被人工标注了1～5个单词本实验先提取数据集里所有图片合适的图像特征和人工标注的关键词作为训练图集数据，然后采用相应的算法求解测试图集各幅图对训练图集最近邻的k幅图片，最后统计这些图片中出现次数前n个的标注作为训练图片的自动标注结果程序首先对corel-5k数据集所有图像进行HSV颜色特征的提取，将训练图像组成一个矩阵，测试图像组成另一个矩阵。一次对测试图像求解相对训练图像的稀疏系数。求解l1范数引用了[8]M. Figueiredo， R. Nowak， and S. Wright的梯度投影法。取出前