作业_张博文_完成稿.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
可视化与可视化分析大作业题目:基于PHOG方法的图像特征提取姓名班级学号分数张博文软1215201292245摘要此次我选择的课题是利用MATLAB完成PHOG方法对图像的特征提取功能。PHOG方法是可视化研究领域的一个非常重要的方法。该方法对于图像处理,图像特征提取,图像识别等都有比较良好的效果。在这次的研究中,我们完成了对PHOG方法程序的解析。明确了PHOG方法的原理,并且能够使用PHOG方法对部分静态图片进行分析和特征提取。实现了对PHOG方法的初步认知和应用。关键词:PHOG;MATLAB;可视化技术;特征提取1课题简介1.1选题介绍本次作业我的选题时PHOG(Pyramid Histogram of Oriented Gradients),即:分层梯度方向直方图。该技术来源于HOG(Histogram of Oriented Gradients),即:方向梯度直方图。PHOG方法是目前计算机视觉、模式识别领域所使用的一种描述图像局部纹理的特征的方法。在可视化领域也被广泛应用。HOG技术简介HOG方法是法国国家计算机技术和控制研究所的研究员在2005年首次提出的。他们主要是将这种方法应用在静态图像中的行人检测上,但在后来,他们也将其应用在电影和视频中的行人检测,以及静态图像中的车辆和常见动物的检测。?HOG描述器最重要的思想是:在一幅图像中,局部目标的表象和形状能够被梯度或边缘的方向密度分布很好地描述。具体的实现方法是:首先将图像分成小的连通区域,然后采集连通区域中各像素点的梯度或边缘的方向直方图。最后把这些直方图组合起来就可以构成特征描述器。为了提高性能,我们还可以把这些局部直方图在图像的更大的范围内进行对比度归一化。通过归一化,能够对光照变化和阴影获得更好的效果。?与其他的描述方法相比,HOG得到的描述结果保持了几何和光学转化不变性(除非物体方向改变)。因此HOG描述尤其适合人的检测。PHOG技术简介PHOG方法,顾名思义,就是将HOG方法和Pyramid相结合。是对同一幅图像进行不同尺度的分割,分割出的每一个尺度(分辨率)就是金字塔的一层。然后对金字塔每层中的HOG进行计算,最后将他们连接成一个很长的一维向量,作为特征。PHOG相对于传统HOG的优点,是可以检测到不同尺度(分辨率)的特征,表达能力更强。缺点是由于对图像分割,导致数据量和计算量都比HOG大了不少。1.2选题来源PHOG方法是目前较为成熟的一种图像分析方法。也是目前可视化技术领域和特征提取领域的常用方法之一,也是一种非常典型的对图像分析方法。主要用于机器对图像特征进行提取和识别。PHOG方法自从被提出以来,其中的技术和思想都已经相对成熟,其中的思维逻辑也相对较为直观。非常适合我们用于可视化技术的学习。PHOG方法用于对静态图像进行分析,有着非常良好的效果。我认为:通过对PHOG方法的学习,我们可以对图像识别技术有一个初步的认识和了解。并且以此为基础,展开对可视化技术方面的学习。2 技术部分2.1 程序概述在该程序中,主要包括一张图片和四段程序。其中,图片是待分析的图像,程序包含一段主程序和三段实现函数。程序的运行顺序图如下图所示:【程序顺序图】2.2函数说明由于该程序由四个部分构成,用于实现对函数特征的提取。根据PHOG方法,在程序完成时会输出一个一维的列向量作为函数的特征值。当图像某一部分改变时,该特征值也会随之改变,实现图像识别。下面对这四个函数的功能和实现分别进行说明。2.2.1 函数anna_phog_demo.m函数代码如下:I = image_0058.jpg;bin = 8;angle = 360;L=3;roi = [1;225;1;300];p = anna_phog(I,bin,angle,L,roi)此函数是整个程序的主函数,声明了所需要分析的图像、划分的区域的数量和金字塔层数,同时声明角度为360°,即确定了此次分析是对有向图的分析。该函数面向用户,提供了用户可以修改的变量并且允许用户对其进行修改。这个函数是整个程序的起点。2.2.2 函数anna_phog.m函数代码如下:function p = anna_phog(I,bin,angle,L,roi)Img = imread(I);if size(Img,3) == 3%① G = rgb2gray(Img);%②else G = Img;endbh = [];bv = [];if sum(sum(G))100%③ E = edge(G,canny);%④ [GradientX,GradientY] = gradient(double(G)); GradientYY = gradient(GradientY); Gr = sqrt((GradientX.*Gradie

文档评论(0)

tu2tu + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档