- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
成果转移转化
基于注意力机制和离群值优化的无监督行人
重识别研究
金吉成
(汉江师范学院,湖北 十堰 442000)
摘要:在开放场景下的跨摄像头目标检索应用中,无监督行人重识别因其规避标注成本的显著优势,展现出
重要的工程应用价值。针对现有无监督方法在特征表征学习和聚类优化方面存在的双重局限,文章从两方面提出
协同优化框架:(1)为增强细粒度特征判别性,设计多尺度注意力融合模块,通过通道-空间双维度的注意力协
同机制强化关键语义特征的捕捉能力,同时抑制背景噪声干扰;(2)针对密度聚类过程中产生的离群样本问题,
构建基于密度感知的离群样本重定位策略,通过动态邻域相似度度量建立离群样本与目标簇的潜在关联,实现离
群样本的渐进式知识迁移。可视化分析结果进一步证实,优化后的特征空间呈现出更清晰的类内聚合与类间分离
特性。
关键词:无监督行人重识别;注意力机制;聚类离群值;特征表征学习;计算机视觉
中图分类号:TP391文献标识码:A
行人重识别是计算机视觉领域的热门研究问题,
旨在从非重合的多个摄像头画面中识别出待匹配的行
人,广泛应用于智能安防和视频监控等领域。有监督
行人重识别比较依赖行人的真实标签信息,往往要付
出大量的人工标记成本,很难满足现实需求;而无监
督行人重识别由于不需要行人真实标签信息,可极大
地节约人力成本,在真实场景下具有更强的实用性和
可扩展性。
1无监督行人重识别方法
目前主流的无监督行人重识别方法流程如图1所
示[1]。第一,对行人图片进行预处理操作;第二,使图1 无监督行人重识别方法流程
用卷积神经网络提取特征;第三,使用聚类算法对特该方法存在几个问题:(1)摄像头拍摄角度、
征向量聚类获取伪标签;第四,将每个簇用一个特征光照环境、行人衣饰、背景噪声等因素会影响拍摄
向量表示,并存放于内存字典中;第五,将伪标签当到的画面质量,导致卷积神经网络提取的特征不全
作训练的真实标签,利用对比学习方法来迭代训练网面;(2)通常使用基于密度的聚类算法(Density-Based
络,并优化伪标签质量。其中,对比学习的过程是在SpatialClusteringofApplicationswithNoise,DBSCAN)对
单个训练轮次中,从本轮聚类结果中采样小批量的样特征向量进行聚类生成伪标签,但在聚类的过程中会
本,使用InfoNCE损失来训练网络,同时更新内存字典产生大量离群值,常规做法是直接丢弃或将其视为
中对应的簇向量,最终使不同簇之间更加远离,同一所有类别的负类,这样做导致离群值不能得到合理利
簇内部更加聚集。用,也会使得模型训练过程变得不稳定。
收稿日期:2025-03-20
基金项目:汉江师范学院科学研究计划项目“基于视频大数据的行人重识别研究 ”(2023B20)。
作者简介:金吉成(1993— ),男,助教,硕士,研究方向为计算机视觉。
089
中阿科技论坛2025年第5期
2改进的无监督行人重识别方法通过学习对不同通道赋予不同的权重,重要通道对应
2.1 基于注意力机制的模型的权重更大。通道注意力能够突出对任务更有用的特
近年来,在计算机视觉任务中,随着研究者对注征通道,抑制噪声或冗余通道,进一步提升模型的特
意力机制的研究深入,注意力机制已成为计算机视征
原创力文档


文档评论(0)