改进YOLOv5系列:引入自注意力机制及卷积集成
YOLOv5是当前计算机视觉领域研究最为活跃的目标检测框架之一,具有精度高、速度快等优点。然而,在实际应用中,YOLOv5也存在一定的缺陷,比如说目标边框不够精确,以及对小目标的识别率较低等问题。基于这些问题,我们提出了ACmix结构的改进方案,引入了自注意力机制和卷积集成,以提升目标检测的效果。
首先,我们在YOLOv5原有的骨干网络中加入了自注意力机制。具体来说,我们采用了SE-Net的思路,在每个卷积层后加入一个全局自注意力模块,以便网络自动调整各个特征通道的权重。此外,我们还增加了Squeeze-and-Excitation的结构,以压缩特征通道维度,进一步提高自注意力效果。具体代码实现如下:
import torch.nn as nn
class SE_Block(nn