- 博客(17)
- 收藏
- 关注
原创 即插即用模块(3) -LSK 特征提取
通过动态调整感受野,自适应提取遥感图像中目标的上下文信息,增强目标与环境关联的建模能力,适用于外观相似但环境差异显著的场景。:对 ( e ) 进行平均池化和最大池化,生成描述符 ( A_{avg} ) 和 ( A_{max} )。:将 ( X ) 与 ( S ) 相乘,生成输出 ( Y )。) 应用深度可分离卷积,生成多尺度特征图序列 () 拼接,通过 1x1 卷积生成特征图 (拼接后通过卷积生成空间注意力图 ( SA )。),加权融合生成注意力特征 ( S )。应用 sigmoid 生成选择掩码 (
2025-04-23 10:06:14
1051
原创 即插即用模块(2) -LAE & MSFM 特征提取+匹配模块
通过自适应保留高信息熵像素,优化降采样过程,保留医学图像中的边缘和角落信息,降低计算复杂度。
2025-04-21 10:42:24
342
原创 即插即用模块(1) -MAFM特征融合
旨在高效融合 RGB 和深度模态的互补信息,充分利用 RGB 图像的丰富纹理细节和深度图像的空间结构特性,同时克服 RGB 对光照变化的敏感性以及深度图像细节不足的局限性。通过多尺度特征整合和非线性变换,MAFM 实现高效的特征融合,同时降低计算复杂度。旨在通过多尺度特征融合,逐步生成包含丰富细节的噪声目标预测图。MCM 采用残差结构,包含多个卷积块,通过整合不同尺度的特征图显著提升解码器的学习能力和泛化性能。
2025-04-20 22:43:03
1333
原创 DEA-Net:基于细节增强卷积和内容引导注意力的单图像去雾
论文中所谓的学习的空间权重就是将CGA的输出结果W。用得到的空间权重w与Low-level features和High-level features进行乘法相加得到。论文中大量使用了四种差分卷积来替换普通的卷积,其可以更好的提取出边缘特征。中心差分卷积的示例图如图1所示。内容引导注意由空间注意力(Spatial attention)和通道注意力(Channel attention),其流程图如图3所示。,然后再与对于的卷积核进行运算。其他三种差分卷积类似,只是差分操作不一样。水平差分卷积如图2所示。
2025-04-20 22:23:50
356
原创 二分类分割:单通道的Sigmoid与双通道的Softmax详解
在二分类分割任务中,常用的输出激活函数有单通道的 Sigmoid 和双通道的 Softmax。二分类分割的目标是将图像中的每个像素分类为前景(通常标记为1)或背景(通常标记为0)。深度学习模型(如U-Net、DeepLab等)通常输出一个与输入图像尺寸相同的特征图,经过激活函数处理后,生成每个像素的分类概率。对于二分类分割,模型输出的特征图是单通道的,每个像素对应一个值,经过Sigmoid激活后,得到该像素属于前景的概率。在输出层,激活函数的选择直接影响模型的输出形式和损失函数的设计。
2025-04-18 23:47:21
477
原创 红外小目标检测的新突破:SLS 损失与 MSHNet
MSHNet 的整体架构如图 4 所示,基于经典 U-Net 结构,包含编码器-解码器和跳跃连接尺度与位置敏感损失(SLS Loss)多尺度头(Multi-Scale Head)这两个组件分别针对 IRSTD 中的尺度与位置敏感性和多尺度目标检测问题进行了优化。
2025-04-16 09:43:13
919
原创 解析NU-net:乳腺超声图像分割的新突破
NU-net的整体架构如图3所示,基于经典U-net的编码器-解码器结构,包含五个下采样五个上采样和跳跃连接更深的骨干U-net(15层)多输出U-net (MOU)多步下采样短连接 (MDSC)这些组件分别针对乳腺超声图像分割中的特征提取、多尺度适应性和长距离信息传递进行了优化。
2025-04-15 08:44:30
1421
1
原创 【ESKNet: 一种增强选择性核卷积的深度监督U-Net用于乳腺超声图像分割】
ESKNet的整体架构如图3所示,基于经典U-Net结构,包含四个下采样四个上采样和四个跳跃连接增强选择性核卷积(ESK)深度监督机制这两个组件分别针对乳腺超声图像分割中的多尺度特征适应性和边界精确性问题进行了优化。
2025-04-10 21:30:22
1141
1
原创 【用于医学图像分割的轻量级边界感知Transformer】
BATFormer的整体架构如图2所示,包括一个轻量级U形主干网络和两个主要组件跨尺度全局Transformer (CGT)边界感知局部Transformer (BLT)这两个组件分别针对医学图像分割中遇到的计算复杂度高和边界失真问题进行了优化。
2024-12-05 21:32:55
935
2
原创 大选择核模块LSK,高效提升分割精度
方法:论文主要介绍了一种用于遥感目标检测的新方法,即大型选择性核网络(LSKNet)。LSKNet的整体架构基于最近流行的结构,并使用了重复的构建块。作者通过定义Rc作为期望选择RF区域与GT边界框区域的比例来研究每个目标类别的感受野范围。如果有想发表论文, 但是有疑惑的小伙伴,可以找我,本人已在这个模型的基础上进行了创新,并实现了大幅涨点,有需要的可以找我。
2024-11-29 11:13:30
642
2
原创 最大、平均、最小池化的作用和应用场景
最大池化(Max Pooling)、最小池化(Min Pooling)和平均池化(Average Pooling)是深度学习中常用的池化操作,主要用于减少特征图的空间维度,同时保留重要的特征信息。
2024-11-28 21:10:36
2117
原创 SFFNet:融合频域和空间域特征提升遥感语义分割效果
发表时间:2024本文提出了一种空间和频域融合网络(SFFNet)框架,旨在充分利用空间信息进行分割,并解决遥感图像分割中处理显著灰度变化区域的挑战。: 使用空间方法提取特征,获得具有充足空间细节和语义信息的特征。:将这些特征映射到空间和频域。在频域映射中,引入了小波变换特征分解器(WTFD)结构,利用Haar小波变换将特征分解为低频和高频成分,并与空间特征结合。为了弥合频域和空间特征之间的语义差距,促进不同表示域特征的有效组合,设计了多尺度双表示对齐滤波器(MDAF)。
2024-11-28 19:57:21
3725
2
原创 1×1卷积就是一个全连接的理解
1×1卷积的基本思想是通过一个1×1的卷积核来对输入张量进行操作。假设当前输入张量的维度为 64 ×64 ×192,卷积核的维度为 1×1 ×192。:通过1×1卷积可以减少后续大尺寸卷积核 (如 5 ×5)的计算量。例如,使用64个 1×1 ×192 的卷积核,可以将输入张量的通道数从192减少到64。假设输入张量的维度为 28 ×28 ×192,输出张量的维度为 28 ×28 × 32,卷积核的大小为 5 ×5。第一步:使用16个 1 ×1 × 192的卷积核将通道数从192减少到16。
2024-11-28 17:06:51
576
原创 一文读懂深度学习中常见的卷积操作
在计算机视觉中,卷积通常指的是二维卷积,用于处理图像等二维数据。卷积过程涉及一个称为卷积核(或滤波器)的小矩阵,该矩阵在输入数据(如图像)上滑动,并与每个位置的相应区域进行点乘后相加,生成新的数值作为输出的一部分。空洞卷积(Atrous Convolution),也被称为膨胀卷积(Dilated Convolution),是一种特殊的卷积操作,其主要特点是能够在不改变卷积核大小的情况下扩大感受野。其中,W1 是输入矩阵的宽度,K是卷积核的宽度,P是填充的宽度,S是步长,而W2则是输出矩阵的宽度。
2024-11-28 16:39:16
1693
【C++面向对象程序设计】学生成绩管理系统设计:基于C++的学生成绩管理功能实现与优化
2025-04-22
Synapse医学图像分割公开数据集
2024-11-28
BUSI乳腺超声图像数据集
2024-11-28
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人