
顶会论文
文章平均质量分 96
Sherlock Ma
研究生在读,致力于分享编程技术。主要研究人工智能相关,包括大模型、AIGC等。偶尔也会更新Java内容
展开
-
LSNet:以小见大,CVPR2025全新轻量级主干网络
本文提出了一种新型的轻量级视觉网络架构——LSNet(Large-Small Network),旨在通过高效的感知和聚合策略,在有限的计算成本下实现高性能的视觉信息处理。LSNet的设计灵感来源于人类视觉系统的“看大,聚焦小”策略,通过结合大核感知(Large-Kernel Perception, LKP)和小核聚合(Small-Kernel Aggregation, SKA)的LS卷积操作,实现了对广泛上下文信息的高效捕获和对小范围特征的精细聚合。大核感知(LKP)原创 2025-05-23 16:46:08 · 1007 阅读 · 0 评论 -
OverLoCK:先概览,再聚焦。CVPR2025全新主干网络
作者提出了一种深度阶段分解策略(Deep-stage Decomposition Strategy, DDS),该策略受人类视觉系统“先概览后细看”(Overview-first-Look-Closely-next)机制的启发,将卷积网络(ConvNet)分解为三个协同工作的子网络:Base-Net(基础网络)、Overview-Net(概览网络)和Focus-Net(聚焦网络)。这种设计旨在通过动态的自上而下的语义引导来增强特征图和卷积核权重,从而提高模型性能。原创 2025-05-23 16:45:26 · 1054 阅读 · 0 评论 -
SAGE:基于SAM进行二级蒸馏的多模态图像融合新方法,CVPR2025
目前将SAM整合用于低级任务的方法通常需要在推理时使用完整的SAM,这在实际应用中显得过于不切实际。为了解决这些问题,作者提出了融合方法SAGE,该方法完全整合并提炼了来自SAM的语义先验。原创 2025-05-20 21:00:15 · 739 阅读 · 0 评论 -
ICLR2025杰出论文揭晓!华人学者闪耀,大模型引领AI前沿!(3篇杰出论文详解)
ICLR 2025的杰出论文涵盖了大语言模型的安全对齐、微调学习动态以及知识编辑等多个关键领域。这些研究不仅揭示了当前大语言模型在安全性和性能优化方面存在的问题,还提出了创新性的解决方案。原创 2025-05-15 15:12:18 · 1161 阅读 · 0 评论