自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 【arXiv 2025 最新】频域注意力模块上线:轻松插拔,性能拉满!

《FMNet:频域辅助的轻量级伪装目标检测网络》 摘要:本文提出了FMNet网络,通过频域注意力机制解决传统伪装目标检测方法存在的三大问题:局部建模能力不足、Transformer计算复杂度高和频率信息利用不充分。创新性地设计了频率-空间融合机制,包含多尺度频率辅助Mamba线性注意力模块(MFM)和频域残差增强模块(FWM),将注意力复杂度从O(H²W²D)降至O(HWD)。实验表明,该方法在大/小目标、遮挡场景下均表现出色,可广泛应用于医学影像、遥感分割等需要精细边缘检测的任务。文末提供了即插即用模块F

2025-06-05 00:26:50 501

原创 【TPAMI 2025】重磅来袭!全新 MSA 掩码分离注意力,分割模型涨点利器,精度再突破!

① 目标难区分:伪装目标与背景在外观上极度相似,导致传统注意力机制难以准确分离前景与背景区域,容易造成目标漏检或误分割。② 全局建模泛化差:常规 Transformer 中所有注意力头作用一致,缺乏功能分工,难以同时兼顾区域内聚焦与区域间对比。

2025-05-27 20:58:23 450

原创 【2025年 即插即用】双坐标注意力机制上线:轻量设计,即插即用,2025新款强势涨点!

🌧️ 存在的问题(背景动因)① 局部感知限制:传统卷积操作由于空间不变性,难以捕捉全局上下文与长距离依赖,导致花卉图像中复杂结构信息提取不足。② 注意力缺陷:现有注意力机制多忽视空间位置信息,仅对通道间关系建模,难以精准定位图像中的关键区域。③ 信息丢失:单一平均池化在聚合特征时容易造成显著细节模糊,影响特征判别性,尤其在背景复杂或光照不均的场景中表现不佳。    💡 解决思路(DCAFE 核心贡献)① 双通道坐标注意力融合:DCAFE 引入并行的平均池化与最大池化方式,增强特征图中

2025-05-26 07:58:52 788

原创 (2025年 CVPR) 频域增强 × 多尺度建模!轻量还原神器 FusedEnhanceBlock 来了!

💡 解决思路(EBlock 核心贡献)① 空间频域融合增强:EBlock 同时融合空间域的多尺度膨胀卷积与频域 MLP 调制,在保留局部细节的同时增强全局结构建模能力,有效应对模糊与照度变化。② 轻量化门控机制:引入SimpleGate 乘性门控结构,在提升特征表达非线性的同时保持计算开销较低,替代传统复杂的注意力机制。③ 归一化与残差耦合设计:采用双 LayerNorm 与 Learnable 残差系数(β、γ)增强训练稳定性和特征调控能力,保

2025-05-20 22:44:34 488

原创 【CVPR 2025】Geometry Self-Attention:即插即用的结构感知模块,显著提升语义分割与视觉理解精度!

本文提出了一种新颖的思路:不再显式编码深度图特征,而是利用其构造图像patch之间的几何关系矩阵,引导注意力权重的空间分配。 通过构建一个融合空间位置与深度差异的几何先验,并引入至自注意力机制中,模型可以自动聚焦于几何相关区域,从而在不引入额外复杂度的前提下,显著提升RGB-D语义理解能力。该方法兼顾性能与效率,为RGB-D语义分割提供了全新的研究范式。

2025-05-04 20:30:42 1341

原创 【AAAI 2025】SNN也能频域建模?FSTA-SNN快速时空注意力模块震撼登场!

本文提出了一种高效的频域时空注意力模块(Frequency-based Spatial-Temporal Attention, FSTA),通过频域分析浅层和深层脉冲输出特征,引导网络在保持学习偏好的同时,有效压制冗余脉冲特征。具体做法是在每个网络层内引入基于离散余弦变换(DCT)的空间注意力模块与时间注意力模块,以提升脉冲特征表达能力并降低能耗,同时引入尺度调节因子避免特征损失,从而在不显著增加计算复杂度的前提下,实现性能和能效的双重提升。

2025-04-29 23:56:09 658

原创 【CVPR 2025】状态空间还可以这样写?EVSS-Win 跨平台解锁非局部视觉建模!

本文提出了一种高效的空间扫描模块(Efficient Visual Scan, EVS),在每个SSM模块前引入几何变换(如翻转与转置),替代多方向扫描策略,仅通过单方向扫描即可捕获非局部空间信息,从而在不显著增加计算复杂度的前提下,有效提升图像恢复质量。该模块充分利用SSM的高效性,同时增强了模型对视觉数据空间结构的建模能力。

2025-04-29 23:53:02 1100

原创 【WACV 2025】前馈结构还能这样改?SEFN 模块精准建模空间依赖!

本文提出了一种空间增强前馈网络(Spatially-Enhanced Feedforward Network, SEFN),通过融合浅层空间信息与深层特征表达,有效提升模型在空间结构建模与区域一致性保持方面的能力:结构保持: 在前馈网络中显式引入空间门控机制,增强特征的区域感知能力;上下文协同: 结合图像前后状态,通过特征对齐与注意调节,强化结构连贯性与上下文一致性。该模块兼顾效率与表达力,为基于状态空间建模的图像修复网络提供了强有力的空间信息补充机制,特别适用于需要高保真结构恢复的

2025-04-29 23:49:55 665

原创 【TCSVT 2025】边缘高斯聚合模块 EGA:目标检测再登 SOTA

EGA 模块通过“高斯建模 + 边缘增强 + 残差融合”的三阶段设计,成功在结构保持与特征增强之间找到平衡点,特别适用于目标检测、图像分割等对边缘敏感的视觉任务。作为一个轻量、模块化的设计,EGA 可灵活集成至主干网络中,为模型带来更强的鲁棒性与表达能力。

2025-04-29 23:38:48 1288

原创 【CVPR 2025】突破微调极限,轻装上阵——涨点神器 Mona:小巧·强大·高效!

本文提出了一种高效的多认知视觉适配器(Multi-cognitive Visual Adapter, Mona),通过引入可调整输入分布的归一化模块与多尺度卷积感知单元,提升适配器对视觉特征的处理能力。具体做法是:在适配器中融合多个深度可分离卷积(3×3、5×5、7×7)构建多认知滤波器组,同时采用加权归一化优化固定层输入特征分布,强化不同尺度、不同认知视角下的特征提取与融合能力。Mona模块作为核心微调单元,广泛验证于图像分类、目标检测、语义分割、实例分割与定向目标检测等任务,在多个代表性视觉基准测试中首

2025-04-29 23:32:43 1445 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除