伪_装-CSDN博客

原创阿里Qwen3：思深，行速

4 月 29 日早 5 点左右，阿里通义千问团队正式发布 Qwen3 系列开源大模型的最新版本。

2025-04-29 17:28:54 743

原创 NVIDIA新模型DAM-3B：描述一切，图像视频局部描述新突破

NVIDIA新模型DAM-3B：描述一切，图像视频局部描述新突破

2025-04-28 11:15:46 1125

最近，基于摄像头的解决方案在场景语义补全（SSC）方面得到了广泛探索。尽管它们在可见区域取得了成功，但现有方法由于频繁的视觉遮挡，在捕捉完整场景语义方面存在困难。为了解决这一局限性，本文提出了第一个卫星-地面协同 SSC 框架，即 SGFormer，探索卫星-地面图像对在 SSC 任务中的潜力。具体来说，我们提出了一种双分支架构，并行编码正交的卫星和地面视图，并将它们统一到公共域中。此外，我们设计了一种地面视图引导策略，在特征编码期间纠正卫星图像偏差，解决卫星和地面视图之间的错位。

2025-04-15 16:22:05 969

原创 vGamba：注意力状态空间瓶颈在视觉识别中有效处理长距离依赖

高效捕获长程依赖关系对视觉识别任务至关重要，但现有方法存在局限。卷积神经网络(CNN)受限于感受野范围，而视觉Transformer(ViT)虽能实现全局上下文建模却计算成本高昂。状态空间模型(SSM)提供了新思路，但其在视觉领域的应用尚未充分探索。本研究提出vGamba混合视觉主干网络，通过整合SSM与注意力机制来提升效率与表征能力。其核心Gamba瓶颈模块包含：适配2D2D2D空间结构的Mamba变体Gamba Cell、多头自注意力机制(MHSA)，以及用于特征表征的门控融合模块。

2025-04-10 15:29:15 364

原创 XLRS-Bench：您能否理解极端大型超高分辨率遥感影像？

多模态大型语言模型（MLLMs）的惊人突破需要新的基准来定量评估其能力、揭示其局限性并指示未来的研究方向。然而，在遥感（RS）的背景下，这具有挑战性，因为图像具有超高清分辨率，包含极其复杂的语义关系。现有的基准通常采用明显小于现实世界 RS 场景的图像尺寸，注释质量有限，且评估维度不足。

2025-04-03 14:13:26 1115

原创 Linux服务器北京时区设置

Linux服务器北京时区设置

2025-04-03 10:56:15 373

原创 Linux服务器部署vLLM环境实战教程

适用于 LLM 的高吞吐量和内存高效推理和服务引擎vLLM环境部署

2025-04-02 17:41:50 1273

原创 Linux服务器安装MinerU

一站式开源高质量数据提取工具，将PDF转换成Markdown和JSON格式。

2025-04-02 17:36:37 982

原创 RoMA: 基于Mamba的遥感基础模型, 已开源, 首次验证mamba的scaling能力

Mamba模型在遥感领域的应用展示了计算机视觉模型架构创新的广阔前景。

2025-03-27 20:39:52 882

原创 Linux服务器安装Oracle客户端

Linux服务器安装Oracle客户端

2025-03-20 10:12:27 522

原创 HuggingFace模型下载指南

HuggingFace模型下载指南

2025-03-06 11:34:19 1640

原创阿里深夜开源QwQ-32B模型，仅需1/10的成本即可比肩R1满血版

凌晨3点，阿里开源了他们全新的推理模型。

2025-03-06 11:03:28 1145

原创 Linux服务器部署Deepseek、Dify、RAGflow实战教程

Linux服务器部署Deepseek、Dify、RAGflow实战教程

2025-03-02 20:56:24 2301

原创 Linux服务器RedHat安装Docker

Linux安装Docker，并配置本地镜像源和yum国内镜像源

2025-03-02 20:49:42 709

原创 Linux服务器安装cuda和cudnn实战教程

Linux服务器安装cuda和cudnn实战教程

2025-03-01 09:44:02 2577

原创 Windows Server 2016系统安装docker

Windows Server 2016系统安装docker

2025-03-01 09:34:37 1854

原创缺少 CMake，无法安装 dlib

缺少 CMake，无法安装 dlib，出现ERROR: Failed to build installable wheels for some pyproject.toml based projects (dlib)

2025-02-28 10:35:32 293

原创 ragflow-mysql 启动失败案例分析

ragflow-mysql 启动失败案例分析，CPU does not support x86-64-v2 Fatal glibc error: CPU does not support x86-64-v2

2025-02-28 10:21:19 3620

原创 DeepSeek-Janus-Pro-7B模型接入vision-agent后端测试chat前端配置代码

使用gguf/DeepSeek-Janus-Pro-7B作为模型后端的服务接入Vision-Agent，config.py代码

2025-02-25 14:17:04 443 8

原创 Dify客户端异常error: a client-side exception has occurred (see the browser console for more i

bug] Dify客户端异常。

2025-02-25 09:23:41 12177 37

原创 Linux常用命令

Linux常用命令大全

2025-02-18 11:22:56 811

原创 Linux升级Anacodna并配置jupyterLab

在使用 Anaconda 的过程中，随着项目和需求的发展，可能需要升级 Anaconda 的 Base 环境中的 Python 版本。本文将详细介绍如何安全地进行升级，包括步骤、代码示例与最终流程图。

2025-02-18 11:08:33 431

原创 Linux安装cuda和cudnn实战教程

Linux服务器安装cuda和cudnn实战教程，Driver CUDA冲突，`cuDNN` 的多个文件（共享库）不是符号链接

2025-02-17 17:32:14 3333 2

原创 Linux服务器配置onnxruntime-gpu

本文实现 `onnxruntime-gpu` 不依赖于服务器主机上 `cuda` 和 `cudnn`，仅使用虚拟环境中的 `cuda` 依赖包实现 `onnx` `GPU` 推理加速的安装教程。为了适配推理节点，因此我们仅在 `base` 下配置环境，不需要重新创建新的虚拟环境。

2025-01-16 18:04:33 1765

原创 [解决方法]libGL.so.1: cannot open shared object file: No such file or directory

在服务器环境配置尝试导入 `opencv` (`cv2`) 模块时，系统找不到 `libGL.so.1` 这个共享库文件。这个问题通常出现在 `Linux` 系统中，特别是当系统缺少必要的图形库时。

2025-01-16 18:00:26 833

原创 MMDetection安装实战教程

MMDetection 支持在 `Linux`，`Windows` 和 `macOS` 上运行，其实在 `Windows` 和 `Linux` 上配置环境区别不大，建议有条件还是在 `Linux` 上配置，它需要 ` Python 3.7 ` 以上，` CUDA 9.2 ` 以上和 ` PyTorch1.8 ` 及其以上。

2025-01-15 15:52:42 1721

原创匹配一切新框架！浙大提出MatchAnything：通过大规模预训练实现通用跨模态图像匹配论文解析(中文版）

图像匹配旨在识别图像之间相应的像素位置，在广泛的科学学科中至关重要，有助于图像配准、融合和分析。

2025-01-15 10:20:35 3172

原创中科院空天院无人机视觉语言导航新基准！AeroVerse：模拟、预训练、微调和评估空中无人机具身世界模型的测试基准

是如何增强无人航空飞行器（UAV）和其他航天平台在四维时空中进行自主感知、认知过程和行动能力，从而实现与人类和环境之间的以自我为中心的活动交互。

2025-01-12 11:40:35 899

原创 GraphReader:基于图的智能体，增强大型语言模型的长文本处理能力

像个善于制作思维导图的导师，将冗长的文本转化为清晰的知识网络，让AI能够像沿着地图探索一样，轻松找到答案需要的各个关键点，有效克服了处理长文本时的"迷路"问题。这篇文章介绍了GraphReader，一种基于图结构的智能体系统，旨在解决大型语言模型（LLMs）处理长文本时遇到的挑战，并在多跳问答等任务上表现出色。

2025-01-09 21:10:30 808

原创谷歌Agents与基础应用白皮书（中文版）

人类非常擅长处理混乱的模式识别任务。然而，他们通常依赖工具 —— 如书籍、Google 搜索或计算器 —— 来补充他们先前的知识，然后才能得出结论。

2025-01-09 20:47:11 1483

原创 Windows下使用bat实现端口映射进程守护

Windows下使用bat实现服务器端口映射到win的进程守护

2025-01-02 17:37:26 293

原创 yolov目标检测的图片onnx输入尺寸及预处理

当你使用不同的图像尺寸（例如1280）进行预测时，YOLOv8会自动对输入图像进行适当的预处理以适配模型。这通常包括缩放和填充操作，确保图像不会发生畸变，同时保持原始宽高比。

2024-12-19 09:58:27 1119

原创 MMYOLO训练实战

mmyolo标注+训练+测试+部署全流程实战演练

2024-12-17 11:39:46 1148

原创 AI领域最伟大的论文检索网站

📑 苏剑林（Jianlin Su）开发的“Cool Papers”网站旨在通过沉浸式体验提升科研工作者浏览论文的效率和乐趣。这个平台的核心优势在于利用Kimi的智能回答功能，帮助用户快速了解论文的常见问题（FAQ），从而更准确地判断论文的价值和相关性，决定是否需要深入阅读。

2024-05-11 12:38:28 1482 2

原创 Att论文解读|ICLR 2018 《Graph attention networks》图注意力网络

我们提出了图注意力网络（GATs），这是一种可在图结构数据上运行的新型神经网络架构，它利用掩码自注意力层来解决之前基于图卷积或其近似值的方法的不足之处。通过堆叠节点能够关注其邻域特征的层，我们能够（隐式地）为邻域中的不同节点指定不同的权重，而不需要任何形式的代价高昂的矩阵运算（如反转），也不依赖于对图结构的预先了解。通过这种方式，我们同时解决了基于谱的图神经网络所面临的几个关键挑战，并使我们的模型可随时应用于归纳和转换问题。

2024-05-11 10:26:18 2610

原创 [Bug]：由于中国防火墙，无法连接 huggingface.co

[Bug]：由于中国防火墙，无法连接 huggingface.co

2024-05-11 09:00:03 1065

原创 Sarcasm detection论文解析 |基于混合自动编码器的模型对社交媒体平台进行讽刺检

早先已经提出了各种单独的自然语言处理技术，但每种技术都有文本上下文和邻近性的限制。它们无法处理不同的内容类型。在本研究论文中，我们使用自动编码器提出了一种基于句子嵌入的新型混合技术。该框架建议使用来自长短期记忆自动编码器、双向编码器表示变换器和通用句子编码器的句子嵌入。此外，还考虑了图像上的文本，以处理图像和视频等多媒体内容。在对各种混合融合模型进行消融研究后，设计出了最终框架。

2024-05-10 20:00:00 1052

原创 Sarcasm detection论文解析 |基于语义知识和辅助信息增强讽刺检测方法

由于中文自身的特点，中文中的讽刺语言检测更加困难。为了缓解中文讽刺检测的这一困境，我们提出了一种语义和辅助增强注意力神经模型--SAAG。在词的层面，我们引入语义知识来增强中文词的表征学习。词素是词义的最小单位，是对词的精细刻画。在句子层面，我们利用一些辅助信息（如新闻标题）来学习讽刺表达的语境和背景表示。然后，我们逐步、动态地构建文本表达的表征。

2024-05-09 20:49:04 1182

原创 Sarcasm detection论文解析 |使用 BERT 进行中间任务迁移学习的刺检测

在本文中，我们调查了当前的最新技术，并提出了基于 BERT 预训练语言模型的讽刺检测的强大基线。我们通过在目标任务上微调之前对相关中间任务进行微调来进一步改进我们的 BERT 模型。具体来说，依靠讽刺与（隐含的负面）情绪和情感之间的相关性，我们探索了一种迁移学习（**Transfer Learning**）框架，该框架使用情感分类和情感检测作为单独的中间任务，将知识注入讽刺检测的目标任务中。

2024-05-08 14:22:56 1019

原创 Sarcasm detection论文解析 |CAT-BiGRU

SDS 是讽刺的一种特殊类别，主要用作产品宣传和营销的有效工具。在本文中，我们提出了一种用于 SDS 检测的新型 CAT-BiGRU 模型。所提出的模型由输入、嵌入、卷积、BiGRU 和两个注意力层组成，并从不同角度对七个数据集进行评估。 CAT-BiGRU 的实验结果很有希望，并且与各种基于神经网络的基线和最先进的方法相比明显更好。这种新型 SDS 检测技术的主要目的之一是增强基于 SDS 的营销策略。

2024-05-07 14:18:09 1080

邱锡鹏著《神经网络与深度学习》案例与实践实验1-5中所需的nndl包

如出现如下问题均可导入nndl包均可解决，将nndl包导入同级目录里面解压即可，或者放入虚拟环境...\Anaconda\envs\paddle\Lib\site-packages中 1、实验中出现from nndl.dataset import load_data报错的 2、No module named 'nndl' 3、运行是显示ModuleNotFoundError: No module named 'nndl' 去下载nndl这个模块的时候显示没有

2023-11-10