摘要
高光谱图像(HSI)分类在遥感(RS)领域至关重要,尤其是随着深度学习技术的不断进步。顺序模型,如循环神经网络(RNNs)和Transformer,已被定制用于此任务,并提供了独特的视角。然而,它们面临几个挑战:1)RNNs在聚合中心特征方面存在困难,并且对干扰像素敏感;2)Transformer需要广泛的计算资源,并且在HSI训练样本有限时往往表现不佳。为了解决这些问题,最近的进展引入了状态空间模型(SSM)和Mamba,它们在线性序列处理中以其轻量级和并行扫描能力而闻名,从而在RNNs和Transformer之间取得了平衡。然而,将Mamba作为HSI分类的主干网络尚未得到充分探索。虽然存在针对视觉任务的改进型Mamba模型,如Vision Mamba(ViM)和Visual Mamba(VMamba),但直接将它们应用于HSI分类会遇到问题。例如,当为中央像素预测实现基于补丁的HSI分类器时,这些模型在特征聚合过程中不能有效地处理具有多尺度感知的土地覆盖语义标记。因此,这些模型对于此任务的适用性仍是一个悬而未决的问题。作为回应,本研究引入了创新的Mamba-in-Mamba(MiM)架构用于HSI分类,标志着Ma