- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
边缘和轮廓的提取是一个非常棘手的工作,细节也许就会被过强的图像线条掩盖,纹理(texture)本身就是一种很弱的边缘分布模式,分级(hierarchical)表示是常用的方法,俗称尺度空间(scalespace)。以前做移动端的视觉平台,有时候不得不把一些图像处理功能关掉,原因是造成了特征畸变。现在CNN模型这种天然的特征描述机制,给图像预处理提供了不错的工具,它能将图像处理和视觉预处理合二为一。
边缘提取
1.HED
整体嵌套边缘检测(Holistically-NestedEdgeDetection,HED是一个深度学习的边缘提取的算法,两个特色:(1)整体图像训练和预测;(2)多尺度、多层特征学习。该深度模型利用全卷积网络,自动学习丰富的分层表示(基于侧面响应的深层监督指导)。
多尺度深度学习可分为四类,即多流学习(multi-stream)、跳网(skip-netlearning)学习、多输入单模型以及独立网训练,如图所示:(a)多流架构;(b)跳网架构;(c)多尺度输入的单一模型;(d)不同网络独立训练;(e)HED,其中添加多个侧面输出。
在表示和计算复杂性方面,(a)-(d)方法存在冗余。(e)HED是一个相对简单的变体,能够从多个尺度产生预测。该结构可以被解释为(d)“独立网络”法的“整体嵌套”版,包括多个侧输出的单流深度网络。隐藏层监督可以改善图像分类任务的优化和泛化。如果需要统一输出,多侧向输出可以灵活地添加额外的融合层。
如图是HED的网络架构图,在卷积层之后插入侧输出层,在每个侧输出层施加深度监督,引导侧输出成为边缘预测。HED输出是多尺度多层,侧输出面变小,感受野变大。一个加权融合层自动学习如何组合来自多个尺度的输出。整个网络通过多个误差传播路径(虚线)训练。
下图给出HED的部分实验结果。(a)测试图像;(b)手工标注的边缘;(c)HED结果。(d)、(e)和(f)卷积神经网络的层2、3和4的侧边响应。(g)、(h)和(i)Canny边缘检测器在尺度σ=2.0、σ=4.0和σ=8.0的边缘响应。HED与Canny在一致性方面显示出明显的优势。
2.CASENet
CASENet将每个边缘像素与多于一个的边缘类相关联,是一种基于ResNet的端到端深度语义边缘学习的架构,同时也是一种跳层(skip-layer)架构,其中顶层卷积层的类别边缘激活共享并与底层特征的同一集融合,这里一种多标签损失函数来监督激活的融合。
三种CNN架构的比较如图(a)-(c)所示。图中实心矩形表示CNN层的组合块。宽度减小表示输出特征图的空间分辨率下降2倍。箭头旁边的数字表示输出特征的通道数。蓝色实心矩形是一堆ResNet块。紫色实心矩形是分类模块。红色虚线框表示输出由损失函数监控。灰色实心矩形是侧面特征提取模块。深绿色实心矩形是融合分类模块,执行K个分组1×1卷积。图(d)-(h)是图(a)-(c)中模块细节,其中矩形是输入和输出特征图。
图(a)是基础网络,采用全卷积网络框架,在ResNet-101删除平均池化和全连接层并保留底部卷积块;将ResNet-101中第一个和第五个卷积块(“res1”和“res5”)的步幅从2改为1;将扩张因子(dilationfactors)引入后续的卷积层以保持原始ResNet相同的感受野;在基础网络的顶部,添加分类模块(图(d))作为1×1卷积层,然后是双线性上采样(由K分组反卷积层实现)产生一个K个激活图{A1,···,AK}的集合,其中每个激活图都与图像尺寸相同;然后,Yk(p)=σ(Ak(p))定义的sigmoid单元对像素属于第k类边缘的概率建模。
前面HED网络的基本思路是除了顶部网络损失以外还考虑底层卷积损失。另外,通过监督侧面激活的线性组合来获得融合边缘图。不过,HED仅执行二进制边缘检测。深度监督网络(DSN)扩展了这种架构,处理侧输出的K通道和最终输出的K通道,如图(b)所示。在该网络中,将上述分类模块连接到每个残差块的输出,产生5个侧分类激活图{A(1),...,A(5)},其中每个激活图都有K通道。然后,通过切片连接层(slicedconcatenationlayer)融合这5个激活图(图中颜色表示图(g)的通道索引)产生5K通道激活图:
Af馈入融合分类层,该分类层执行K-组1×1卷积(图(f))产生K-通道激活图A(6)。最后,在激活图{A(1),...,A(6)}计算6个损失函数,为该网络提供深入监督。
由于监督5个侧面激活,隐含地约束了那些侧面激活的每个通道只带有该类别最相关的信息。由于切片级联和分组卷积
文档评论(0)