- 博客(118)
- 收藏
- 关注
原创 SGFormer:卫星-地面融合 3D 语义场景补全
最近,基于摄像头的解决方案在场景语义补全(SSC)方面得到了广泛探索。尽管它们在可见区域取得了成功,但现有方法由于频繁的视觉遮挡,在捕捉完整场景语义方面存在困难。为了解决这一局限性,本文提出了第一个卫星-地面协同 SSC 框架,即 SGFormer,探索卫星-地面图像对在 SSC 任务中的潜力。具体来说,我们提出了一种双分支架构,并行编码正交的卫星和地面视图,并将它们统一到公共域中。此外,我们设计了一种地面视图引导策略,在特征编码期间纠正卫星图像偏差,解决卫星和地面视图之间的错位。
2025-04-15 16:22:05
969
原创 vGamba:注意力状态空间瓶颈在视觉识别中有效处理长距离依赖
高效捕获长程依赖关系对视觉识别任务至关重要,但现有方法存在局限。卷积神经网络(CNN)受限于感受野范围,而视觉Transformer(ViT)虽能实现全局上下文建模却计算成本高昂。状态空间模型(SSM)提供了新思路,但其在视觉领域的应用尚未充分探索。本研究提出vGamba混合视觉主干网络,通过整合SSM与注意力机制来提升效率与表征能力。其核心Gamba瓶颈模块包含:适配2D2D2D空间结构的Mamba变体Gamba Cell、多头自注意力机制(MHSA),以及用于特征表征的门控融合模块。
2025-04-10 15:29:15
364
原创 XLRS-Bench:您能否理解极端大型超高分辨率遥感影像?
多模态大型语言模型(MLLMs)的惊人突破需要新的基准来定量评估其能力、揭示其局限性并指示未来的研究方向。然而,在遥感(RS)的背景下,这具有挑战性,因为图像具有超高清分辨率,包含极其复杂的语义关系。现有的基准通常采用明显小于现实世界 RS 场景的图像尺寸,注释质量有限,且评估维度不足。
2025-04-03 14:13:26
1115
原创 RoMA: 基于Mamba的遥感基础模型, 已开源, 首次验证mamba的scaling能力
Mamba模型在遥感领域的应用展示了计算机视觉模型架构创新的广阔前景。
2025-03-27 20:39:52
882
原创 缺少 CMake,无法安装 dlib
缺少 CMake,无法安装 dlib,出现ERROR: Failed to build installable wheels for some pyproject.toml based projects (dlib)
2025-02-28 10:35:32
293
原创 ragflow-mysql 启动失败案例分析
ragflow-mysql 启动失败案例分析,CPU does not support x86-64-v2 Fatal glibc error: CPU does not support x86-64-v2
2025-02-28 10:21:19
3620
原创 DeepSeek-Janus-Pro-7B模型接入vision-agent后端测试chat前端配置代码
使用gguf/DeepSeek-Janus-Pro-7B作为模型后端的服务接入Vision-Agent,config.py代码
2025-02-25 14:17:04
443
8
原创 Dify客户端异常error: a client-side exception has occurred (see the browser console for more i
bug] Dify客户端异常。
2025-02-25 09:23:41
12177
37
原创 Linux升级Anacodna并配置jupyterLab
在使用 Anaconda 的过程中,随着项目和需求的发展,可能需要升级 Anaconda 的 Base 环境中的 Python 版本。本文将详细介绍如何安全地进行升级,包括步骤、代码示例与最终流程图。
2025-02-18 11:08:33
431
原创 Linux安装cuda和cudnn实战教程
Linux服务器安装cuda和cudnn实战教程,Driver CUDA冲突,`cuDNN` 的多个文件(共享库)不是符号链接
2025-02-17 17:32:14
3333
2
原创 Linux服务器配置onnxruntime-gpu
本文实现 `onnxruntime-gpu` 不依赖于服务器主机上 `cuda` 和 `cudnn`,仅使用虚拟环境中的 `cuda` 依赖包实现 `onnx` `GPU` 推理加速的安装教程。为了适配推理节点,因此我们仅在 `base` 下配置环境,不需要重新创建新的虚拟环境。
2025-01-16 18:04:33
1765
原创 [解决方法]libGL.so.1: cannot open shared object file: No such file or directory
在服务器环境配置尝试导入 `opencv` (`cv2`) 模块时,系统找不到 `libGL.so.1` 这个共享库文件。这个问题通常出现在 `Linux` 系统中,特别是当系统缺少必要的图形库时。
2025-01-16 18:00:26
833
原创 MMDetection安装实战教程
MMDetection 支持在 `Linux`,`Windows` 和 `macOS` 上运行,其实在 `Windows` 和 `Linux` 上配置环境区别不大,建议有条件还是在 `Linux` 上配置,它需要 ` Python 3.7 ` 以上,` CUDA 9.2 ` 以上和 ` PyTorch1.8 ` 及其以上。
2025-01-15 15:52:42
1721
原创 匹配一切新框架!浙大提出MatchAnything:通过大规模预训练实现通用跨模态图像匹配论文解析(中文版)
图像匹配旨在识别图像之间相应的像素位置,在广泛的科学学科中至关重要,有助于图像配准、融合和分析。
2025-01-15 10:20:35
3172
原创 中科院空天院无人机视觉语言导航新基准!AeroVerse:模拟、预训练、微调和评估空中无人机具身世界模型的测试基准
是如何增强无人航空飞行器(UAV)和其他航天平台在四维时空中进行自主感知、认知过程和行动能力,从而实现与人类和环境之间的以自我为中心的活动交互。
2025-01-12 11:40:35
899
原创 GraphReader:基于图的智能体,增强大型语言模型的长文本处理能力
像个善于制作思维导图的导师,将冗长的文本转化为清晰的知识网络,让AI能够像沿着地图探索一样,轻松找到答案需要的各个关键点,有效克服了处理长文本时的"迷路"问题。这篇文章介绍了GraphReader,一种基于图结构的智能体系统,旨在解决大型语言模型(LLMs)处理长文本时遇到的挑战,并在多跳问答等任务上表现出色。
2025-01-09 21:10:30
808
原创 谷歌Agents与基础应用白皮书(中文版)
人类非常擅长处理混乱的模式识别任务。然而,他们通常依赖工具 —— 如书籍、Google 搜索或计算器 —— 来补充他们先前的知识,然后才能得出结论。
2025-01-09 20:47:11
1483
原创 yolov目标检测的图片onnx输入尺寸及预处理
当你使用不同的图像尺寸(例如1280)进行预测时,YOLOv8会自动对输入图像进行适当的预处理以适配模型。这通常包括缩放和填充操作,确保图像不会发生畸变,同时保持原始宽高比。
2024-12-19 09:58:27
1119
原创 AI领域最伟大的论文检索网站
📑 苏剑林(Jianlin Su)开发的“Cool Papers”网站旨在通过沉浸式体验提升科研工作者浏览论文的效率和乐趣。这个平台的核心优势在于利用Kimi的智能回答功能,帮助用户快速了解论文的常见问题(FAQ),从而更准确地判断论文的价值和相关性,决定是否需要深入阅读。
2024-05-11 12:38:28
1482
2
原创 Att论文解读|ICLR 2018 《Graph attention networks》图注意力网络
我们提出了图注意力网络(GATs),这是一种可在图结构数据上运行的新型神经网络架构,它利用掩码自注意力层来解决之前基于图卷积或其近似值的方法的不足之处。通过堆叠节点能够关注其邻域特征的层,我们能够(隐式地)为邻域中的不同节点指定不同的权重,而不需要任何形式的代价高昂的矩阵运算(如反转),也不依赖于对图结构的预先了解。通过这种方式,我们同时解决了基于谱的图神经网络所面临的几个关键挑战,并使我们的模型可随时应用于归纳和转换问题。
2024-05-11 10:26:18
2610
原创 Sarcasm detection论文解析 |基于混合自动编码器的模型对社交媒体平台进行讽刺检
早先已经提出了各种单独的自然语言处理技术,但每种技术都有文本上下文和邻近性的限制。它们无法处理不同的内容类型。在本研究论文中,我们使用自动编码器提出了一种基于句子嵌入的新型混合技术。该框架建议使用来自长短期记忆自动编码器、双向编码器表示变换器和通用句子编码器的句子嵌入。此外,还考虑了图像上的文本,以处理图像和视频等多媒体内容。在对各种混合融合模型进行消融研究后,设计出了最终框架。
2024-05-10 20:00:00
1052
原创 Sarcasm detection论文解析 |基于语义知识和辅助信息增强讽刺检测方法
由于中文自身的特点,中文中的讽刺语言检测更加困难。为了缓解中文讽刺检测的这一困境,我们提出了一种语义和辅助增强注意力神经模型--SAAG。在词的层面,我们引入语义知识来增强中文词的表征学习。词素是词义的最小单位,是对词的精细刻画。在句子层面,我们利用一些辅助信息(如新闻标题)来学习讽刺表达的语境和背景表示。然后,我们逐步、动态地构建文本表达的表征。
2024-05-09 20:49:04
1182
原创 Sarcasm detection论文解析 |使用 BERT 进行中间任务迁移学习的刺检测
在本文中,我们调查了当前的最新技术,并提出了基于 BERT 预训练语言模型的讽刺检测的强大基线。我们通过在目标任务上微调之前对相关中间任务进行微调来进一步改进我们的 BERT 模型。具体来说,依靠讽刺与(隐含的负面)情绪和情感之间的相关性,我们探索了一种迁移学习(**Transfer Learning**)框架,该框架使用情感分类和情感检测作为单独的中间任务,将知识注入讽刺检测的目标任务中。
2024-05-08 14:22:56
1019
原创 Sarcasm detection论文解析 |CAT-BiGRU
SDS 是讽刺的一种特殊类别,主要用作产品宣传和营销的有效工具。在本文中,我们提出了一种用于 SDS 检测的新型 CAT-BiGRU 模型。所提出的模型由输入、嵌入、卷积、BiGRU 和两个注意力层组成,并从不同角度对七个数据集进行评估。 CAT-BiGRU 的实验结果很有希望,并且与各种基于神经网络的基线和最先进的方法相比明显更好。这种新型 SDS 检测技术的主要目的之一是增强基于 SDS 的营销策略。
2024-05-07 14:18:09
1080
邱锡鹏著 《神经网络与深度学习》案例与实践实验1-5中所需的nndl包
2023-11-10
单级放大电路的搭建与测试
2023-03-22
模拟电子技术实验指导书
2023-03-22
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人