自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(109)
  • 收藏
  • 关注

原创 DeepSpeed常见面试问题

✅ 回答思路:作用:解决大模型训练的显存瓶颈、加速训练、优化大规模分布式训练。为什么用:单GPU显存不够,训练不了几十亿/百亿参数模型。ZeRO优化可以分散存储优化器状态、梯度、参数。支持混合精度(FP16/BF16)。支持offload到CPU/磁盘,进一步节省显存。整合到Hugging Face / PyTorch生态,易用性高。✅ 加分点:举个实际例子,比如"我们用DeepSpeed训练一个65B的模型,在8张A100上能跑起来"。✅ 回答思路:ZeRO全称:Zero Redundancy Optim

2025-05-28 16:54:07 982

原创 如何使用DeepSpeed来训练大模型

DeepSpeed是微软开源的分布式训练加速库,支持高效训练百亿/千亿参数大模型,优化显存与计算效率。其核心功能包括ZeRO优化器、Offload技术、混合精度训练等,适用于SFT、预训练和微调任务。

2025-05-28 16:49:29 332

原创 INFERENCE SCALING FOR LONG-CONTEXT RETRIEVAL AUGMENTED GENERATION

解决了两个关键问题:(1) 在最佳配置下,RAG 性能如何从推理计算的扩展中受益?(2) 我们能否通过对 RAG 性能和推理参数之间的关系进行建模来预测给定预算的最佳测试时间计算分配?我们的观察表明,在最佳分配时,增加推理计算会导致 RAG 性能近乎线性的提高,我们将这种关系描述为 RAG 的推理缩放定律。在此基础上,我们进一步开发了计算分配模型,以估计不同推理配置的 RAG 性能。该模型预测了各种计算约束下的最佳推理参数,这与实验结果密切相关。

2025-04-20 23:46:31 997

原创 From RAG to Memory: Non-Parametric Continual Learning for Large Language Models

我们不断获取、组织和利用知识的能力是人类智能的一个关键特征,AI 系统必须接近它才能释放其全部潜力。鉴于使用大型语言模型 (LLM) 进行持续学习的挑战,检索增强生成 (RAG) 已成为引入新信息的主要方式。然而,它对向量检索的依赖阻碍了它模拟人类长期记忆的动态和相互关联性质的能力。最近的 RAG 方法用各种结构(如知识图谱)增强了向量嵌入,以解决其中一些差距,即意义建构和关联性。但是,它们在更基本的事实内存任务上的性能远低于标准 RAG。我们解决了这种意外的恶化并提出了 HippoRAG 2,这是一个在事

2025-04-20 21:58:30 633

原创 Universal scaling hypothesis of quantum spatial search in complex networks

由于网络上的量子空间搜索具有很强的网络依赖性,因此出现了一个问题,即这种量子算法中是否存在适用于各种网络的通用视角。在这里,我们提出了一个通用的缩放假设,即在复杂网络(如小世界和无标度网络)上进行量子空间搜索。平均路径长度是复杂网络科学中的一个关键量,可用于揭示这一通用特征,其中可以为最佳时间、最大找到概率和最佳跳跃参数生成坍缩图。基于路径积分法,我们还阐明了连续时间量子游走中的概率幅度可以由路径长度分布决定。

2025-04-15 13:44:54 994

原创 AUTO-RAG: AUTONOMOUS RETRIEVAL-AUGMENTED GENERATION FOR LARGE LANGUAGE MODELS

文章开发了一种在迭代检索中自主合成基于推理的决策指令的方法,并对最新的开源 LLM 进行了微调。实验结果表明,Auto-RAG 能够与检索器进行自主迭代交互,有效利用 LLM 卓越的推理和决策能力,从而在六个基准中取得优异的表现。进一步分析表明,Auto-RAG 可以根据问题的难度和检索到的知识的效用自主调整迭代次数,而无需任何人工干预。此外,Auto-RAG 以自然语言表达迭代检索过程,增强可解释性,同时为用户提供更直观的体验。

2025-04-12 17:07:48 928

原创 Lbael Studio关系标注

LabelStudio是一款开源数据标记工具,在一个平台上支持多个项目、用户和数据类型。它允许您执行以下操作:使用多种数据格式执行不同类型的标记。将LabelStudio与机器学习模型集成,为标签(预标签)提供预测,或执行持续主动学习。

2025-01-18 18:35:37 886 1

原创 运动健康中的实体和关系

体育健康领域的常用实体和关系种类繁多,涉及个人的健康状况、运动习惯、训练计划、营养、疾病管理等多个方面。通过理解这些实体及其关系,可以帮助制定个性化的健康管理计划,提升运动效果,甚至预防疾病。在构建相关系统时,实体的分类和关系的建模非常重要,能有效地支持数据分析、健康监控和个性化推荐等应用。

2024-12-24 19:46:44 1075

原创 Sora尝鲜:OpenAI的视频创作的文本生成平台

近年来,人工智能在各个领域的应用正在发生深刻变革,其中最引人注目的之一便是文本生成视频技术。2024年12月,OpenAI推出了其最新的AI工具——Sora,一个基于文本描述生成短视频的强大平台。Sora不仅能为创作者提供全新的创作工具,还为内容生产带来了更高的效率和创意空间。今天,我们将深入探讨Sora的功能、应用场景以及它如何改变视频创作行业。Sora是OpenAI推出的文本到视频(Text-to-Video)模型,可以根据用户输入的文本描述生成对应的短视频。这项技术的发布标志着AI在视频内容生成方面的

2024-12-10 17:24:24 1085

原创 ModuleNotFoundError: No module named ‘torchcrf‘

注意安装对应版本的pytorch-crf。

2024-11-25 23:00:51 539

原创 新系统如何进行模型环境配置

在机器学习和深度学习中,一个良好的开发环境能够显著提高工作效率。本篇博客将详细介绍如何在新的Linux系统(以Ubuntu为例)上进行模型环境的配置,包括基础系统设置、Python虚拟环境搭建、常用库的安装以及GPU驱动和CUDA的安装等。

2024-11-08 20:59:06 713

原创 自然语言处理(NLP)论文数量的十年趋势:2014-2024

近年来,自然语言处理(NLP)已成为人工智能(AI)和数据科学领域中的关键技术之一。随着数据规模的不断扩大和计算能力的提升,NLP技术从学术研究走向了广泛的实际应用。通过观察过去十年(2014-2024年)NLP领域的论文数量增长趋势,我们可以看到一个从稳步发展到爆发式增长的过程。这一趋势反映了NLP领域的技术进步以及其在众多行业中的应用价值。

2024-10-11 16:49:44 1554

原创 信息抽取数据集处理——RAMS

RAMS数据集(RAMS:Richly Annotated Multilingual Schema-guided Event Structure)由约翰斯·霍普金斯大学于2020年发布,是一个以新闻为基础的事件抽取数据集。它标注了9,124个事件,涵盖了139种不同的事件类型和65种元素角色类型。这个数据集非常适合用于事件抽取、自然语言处理任务,特别是对事件结构、事件角色的识别和分类。

2024-10-11 16:19:26 2094

原创 LaTEX常用基本模板:中文

在学术和技术写作中,LaTeX 是一款非常流行且强大的文档排版工具。它特别适合处理包含复杂数学公式、图表、表格以及其他精确排版需求的文档。本文将通过一个完整的 LaTeX 模板,介绍如何编写包含多种基本样式的 LaTeX 文档。

2024-10-09 11:46:52 6989

原创 TTM-RE: Memory-Augmented Document-Level Relation Extraction(内存增强的文档级关系提取)

文档级关系提取旨在对文档中任意两个实体之间的关联进行分类。以往的文档级关系提取方法在充分利用不同噪声水平的大量训练数据的潜力方面是无效的。例如,在ReDocRED基准数据集中,在大规模、低质量、远距离监督的训练数据上训练的最先进的方法通常不会比那些仅在较小、高质量、人工注释的训练数据上训练的方法表现得更好。为了充分释放大规模噪声训练数据在文档级关系提取方面的潜力,我们提出了TTM-RE,一种新的方法,集成了可训练内存模块,称为令牌图灵机,与噪声鲁棒损失函数来解释正未标记设置。在用于文档级关系提取的基准数据集

2024-10-09 11:32:59 1069

原创 给出自然数上的除法运算,并证明其是原始递归的

给出自然数上的除法运算,并证明其是原始递归的。

2024-10-06 21:49:51 439 2

原创 A Two-Stream AMR-enhanced Model for Document-levelEvent Argument Extraction(TSAR)

以往的大多数研究都是从单个句子中提取事件,而文档级事件提取仍未得到充分探索。在本文中,我们着重于从整个文档中提取事件参数,这主要面临两个关键问题: a)触发器和句子参数之间的长距离依赖关系;b)对文档中事件的分散上下文。为了解决这些问题,文章提出了一个双流抽象意义表示增强提取模型(TSAR)。通过双流编码模块从不同的角度对文档进行编码,利用局部和全局信息,降低分散上下文的影响。此外,还引入了一个由AMR引导的交互模块,基于局部和全局构建的AMR语义图,同时捕获句子内和句子间的特征。

2024-10-06 16:53:32 835

原创 事件抽取(Event Extraction, EE)

事件抽取(Event Extraction, EE)是信息抽取领域中的一个重要任务,旨在从非结构化文本中识别和抽取事件相关的信息。事件抽取通常包括识别事件触发词、事件类型以及事件中的参与者、时间、地点等元素,最终将这些信息结构化地表示出来。事件抽取是自然语言处理(NLP)中的一个挑战性问题,广泛应用于新闻分析、舆情监控、情报分析等场景。

2024-10-05 17:05:05 3755

原创 优雅的回文数判断:Python

回文数是一种特殊的数字,它从左到右和从右到左读起来都是一样的。这种特性使得回文数在数学和编程中都非常有趣。回文数的概念不仅限于整数,也可以扩展到字符串和其他数据类型。编写优雅的代码不仅仅是为了美观,它还能提高代码的可读性和可维护性。通过使用 Python 的强大特性,如类型注解和切片操作,我们可以创建简洁而功能强大的函数。回文数判断函数是一个展示 Python 编程优雅性的优秀例子。希望这个函数能激发你在编程中追求简洁和效率的灵感。

2024-08-22 14:18:01 356 2

原创 Gemma Chat【所有人都能本地部署的对话AI】

Gemma Chat 项目是对现代通讯需求的直接回应,它通过利用前沿技术和开源社区的力量,提供了一个稳定、可扩展的聊天解决方案。无论你是寻找一个企业级聊天系统还是简单的社交应用,Gemma Chat 都是一个值得考虑的选择。访问Docker Hub页面和GitHub仓库来了解更多信息和下载源代码。

2024-08-19 11:53:51 1236

原创 Nginx+React在Docker中实现项目部署

Nginx 是一个高性能的 HTTP 和反向代理服务器,也能够处理 IMAP/POP3/SMTP 服务,由 Igor Sysoev 开发并在 2004 年首次公开发布。它以处理静态内容、提供反向代理服务以及其高稳定性、低资源消耗而广受欢迎。Nginx 能够通过非阻塞方式处理多个连接,使其成为管理高并发请求的理想选择。此外,Nginx 还支持负载均衡和邮件代理,以及通过模块扩展更多功能,如 WebSockets 和流媒体支持。

2024-02-08 15:14:58 1875

原创 【报错处理】ModuleNotFoundError: No module named ‘paddle.fluid‘

在使用 UIE(统一信息提取)模型时,您可能会遇到错误消息 "ModuleNotFoundError: No module named 'paddle.fluid'"。这个错误可能让人沮丧,但通常很容易解决。在本博客文章中,我将为您介绍解决此问题。

2024-01-27 18:06:59 11911

原创 Linux网络管理工具tc

是用来管理和配置队列规则的命令。在 Linux 的网络堆栈中,每个网络接口都可以有自己的队列规则,这些规则决定了数据包如何在网络接口上排队、被处理和发送。通过不同的 qdisc 类型和参数,管理员可以精细地控制网络流量,例如限制带宽、控制延迟、优先处理特定类型的流量等。上添加一个新的队列规则(qdisc, queueing discipline)。是一个非常强大的工具,用于控制网络设备上的数据包队列处理。在 Linux 系统中使用。这个命令的作用是在网络接口。网络接口上的根队列规则。这个命令的作用是删除。

2024-01-18 20:56:16 998

原创 Hugging Face怎么通过国内镜像去进行模型下载(hf-mirror.com)

Hugging Face 是一家专注于自然语言处理(NLP)技术的公司,以其开源贡献和先进的机器学习模型而闻名。该公司最著名的产品是 Transformers 库,这是一个广泛使用的 Python 库,它提供了大量预训练模型,如 BERT、GPT-2、T5 和其他模型,这些模型可以用于各种 NLP 任务,如文本分类、情感分析、文本生成等。Hugging Face 还提供一个在线平台,允许社区成员共享和协作他们的模型。

2024-01-18 20:49:58 18052 8

原创 snmp协议配置

SNMP 使用一套定义了不同类型的消息(如 Get、Set、Trap 等)和数据结构(如 OID、MIB 等)的规范,在网络管理中起到重要的作用。它可以用于获取设备的配置信息、监视设备的性能指标、远程配置设备参数、诊断问题和发送警报等。SNMP(Simple Network Management Protocol)是一种网络管理协议,用于管理和监控网络设备、操作系统和应用程序。总之,SNMP 是一种用于网络管理的协议,它提供了一种标准化的方法,使管理员能够监控和管理网络设备、操作系统和应用程序。

2024-01-12 19:49:18 1411

原创 git新建分支并提交

这些步骤将帮助你在Git中成功创建一个新的分支并提交你的更改。记得在进行更改时经常提交,这样可以更好地跟踪和管理更改的历史记录。使用git branch命令创建一个新的分支。使用git commit命令提交你的更改。你应该提供一个描述性的提交信息,说明你所做的更改。暂存更改:使用git add命令暂存你的更改。在你的项目中做出所需的更改。如果你的分支是与他人共享或与远程仓库同步的,你需要使用。使用git checkout命令切换到你的新分支。使用‘cd’命令进入Git项目目录。命令将更改推送到远程仓库。

2024-01-10 21:08:07 1139

原创 GoLang:sql.Exec()报错

Sorry, can not exec into mysql: Error 1064 (42000): You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near ...

2024-01-10 20:56:08 979

原创 NVIDIA Container Toolkit(NVIDIA Docker)

Nvidia Docker该项目已被取代。此存储库提供的工具已被弃用,并且该存储库已存档。不再支持包装器,并且 NVIDIA Container Toolkit 已进行扩展,允许用户配置 Docker 以使用 NVIDIA Container Runtime。NVIDIA 容器工具包允许用户构建和运行 GPU 加速容器。该工具包包括一个容器运行时和实用程序,用于自动配置容器以利用 NVIDIA GPU。

2024-01-09 14:40:41 2229 1

原创 rrd数据库高并发下的劣势

RRD(Round-Robin Database)数据库是一种用于处理时间序列数据(如网络带宽、温度、股票市场数据等)的专用数据库系统,由 Tobi Oetiker 创建。它的主要特点是固定大小存储,意味着新数据会覆盖最旧的数据,实现高效的数据存取。RRD 专为存储和处理按固定间隔收集的数据而设计,支持多种数据源类型和数据聚合功能,可以生成时间序列图表,广泛应用于系统监控和容量规划等领域。然而,在处理大规模数据时,RRD 有一些劣势。

2024-01-08 15:22:45 584

原创 Docker Compose 安装

Docker Compose 是一个用于定义和运行多容器 Docker 应用程序的工具,允许用户通过一个 YAML 格式的文件来配置应用程序所需的所有服务。它主要用于简化多容器环境的管理,使得用户可以用一个命令同时启动、停止和重建应用程序中的所有服务。这个工具自动处理服务间的网络配置,使它们可以轻松相互通信,并支持卷挂载来实现数据持久化。

2024-01-08 10:13:53 5076

原创 精确管理Python项目依赖:自动生成requirements.txt的智能方法

requirements.txt这个文件通常用于列出项目所需的所有依赖包及其版本,使其他人或系统可以轻松地重现相同的环境。如果你已经在使用像Poetry这样的现代工具,那么利用这些工具的内置功能是有意义的。如果你使用的是Poetry或类似的现代Python包管理工具,它们通常会自己维护依赖文件(如。选择哪种方法取决于你的项目需求和你的工作流程。命令将会列出当前Python环境中安装的所有包及其版本。文件,而不是列出环境中安装的所有包。这将创建一个包含所有当前环境中安装的库的。

2024-01-08 09:25:49 2359

原创 MySQL忘记密码,如何重置密码(Windows)

打开“服务”管理工具(可以在开始菜单搜索“服务”或运行找到你的MySQL服务,可能叫别的,但是应该都是mysql开头的。鼠标右键停止运行它。

2024-01-07 18:30:34 4770 5

原创 GoLang vs Python

Python和Go是两种非常不同的编程语言,它们在设计哲学、用途和特性方面有各自的优势和局限性。

2024-01-06 15:57:01 987

原创 GoLang:gRPC协议的介绍以及详细教程,从Protocol开始

gRPC(Google Remote Procedure Call)是一个由Google开发的高性能、开源RPC(远程过程调用)框架。它基于HTTP/2进行数据传输,使用ProtoBuf(Protocol Buffers)作为接口描述语言,支持多种编程语言,如Java、Go、C#等,适用于不同语言环境。gRPC的显著特点包括其高效的通信性能,支持双向流、多路复用和二进制传输,以及集成的安全机制,如SSL/TLS。这些特性使gRPC特别适合用于构建高性能的分布式系统和微服务架构中的服务间通信,尤其在需要处理大

2024-01-06 12:58:29 2600

原创 Gin:GoLang语言Web应用快速入门

通过以上步骤,你就成功使用Go的Gin框架创建了一个基本的Hello World程序。这个程序创建了一个web服务器,监听8080端口,并且对根路径()的GET请求响应“Hello World”。Gin是一个非常强大且易用的web框架,非常适合用于构建RESTful API和web应用程序。

2024-01-04 20:54:28 1680 1

原创 go语言多线程操作

多线程是一种编程概念,它允许操作系统同时处理多个任务。在多线程环境中,每个线程都代表了一个任务的执行流程。这些线程可以同时运行,使得程序能够更有效地利用计算资源,特别是在多核处理器的系统中。

2024-01-04 20:38:43 2724

原创 php composer安装

Composer 是 PHP 中的依赖管理工具。它允许您声明您的项目所依赖的库,并且它将为您管理(安装/更新)它们。

2024-01-03 21:25:58 796

原创 构建 PHP 开发环境:使用 Docker 和阿里云镜像加速器

Dockerfile:这是一个文本文件,包含了一系列的指令,用于定义如何构建 Docker 镜像。例如,它可以包含从基础镜像开始、安装软件包、复制文件和设置环境变量的指令。镜像(Image):Docker 镜像是一个轻量级、独立、可执行的软件包,包含运行应用所需的一切:代码、运行时、库、环境变量和配置文件。容器(Container):当 Docker 镜像运行时,它在 Docker 引擎上运行的实例就是一个容器。容器是应用程序及其运行环境的封装。仓库(Registry)

2024-01-03 21:18:57 1498

原创 PHP下载安装以及基本配置

和客户端的 JavaScript 不同的是,PHP 代码是运行在服务端的。如果在服务器上建立了如上例类似的代码,则在运行该脚本后,客户端就能接收到其结果,但他们无法得知其背后的代码是如何运作的。使用 PHP 的最大的好处是它对于初学者来说极其简单,同时也给专业的程序员提供了各种高级的特性。",超文本预处理器的字母缩写)是一种被广泛应用的开放源代码的多用途脚本语言,它可嵌入到 HTML中,尤其适合 web 开发。如果有像我这样的输出,就说明安装成功啦!打开新的命令行窗口,不在安装路径下,输入。

2023-12-22 21:33:56 9495 3

原创 golang:Excel写入mysql数据库

结构体中的数据库连接信息,并根据实际情况修改插入操作的SQL语句和字段映射。上述示例假设Excel文件中的每一行数据对应MySQL表中的字段,这可能需要根据实际情况进行调整。要将读取的每个Sheet中的数据分别写入不同的MySQL数据库,你需要使用Go语言的MySQL数据库驱动,以及合适的数据库连接和插入逻辑。等库来处理MySQL数据库连接和操作。

2023-12-21 20:40:09 756

RAMS-1.0 数据集

RAMS数据集(RAMS:Richly Annotated Multilingual Schema-guided Event Structure)由约翰斯·霍普金斯大学于2020年发布,是一个以新闻为基础的事件抽取数据集。它标注了9,124个事件,涵盖了139种不同的事件类型和65种元素角色类型。事件类型涉及多个领域,如: 生命事件(life) 冲突事件(conflict) 灾难事件(disaster) 司法事件(justice) 联络事件(contact) 政府事件(government) 而元素角色类型包括如: 地点(place) 参与者(participant) 目的地(destination) 起源(origin) 受害者(victim) 被告人(defendant) 这个数据集非常适合用于事件抽取、自然语言处理任务,特别是对事件结构、事件角色的识别和分类。

2024-10-11

UFM用户手册(nvidia-ufm-enterprise-user-manual-v6-15-1)

NVIDIA UFM(Unified Fabric Manager)企业版用户手册(版本6.15.1)涵盖了用于管理InfiniBand规模计算环境的UFM平台的各个方面。 文档开始介绍了UFM的主要特点、新功能和变更、不支持的功能/特性、安装说明、此版本中修复的错误、已知问题以及历史变更和新功能。UFM的主要优势包括中央织物管理控制台、深入的织物可视性和控制、多隔离应用环境的支持、面向服务的自动资源配置、快速解决织物问题的能力、无缝故障转移处理和开放架构。UFM的主要功能模块包括织物仪表板、织物分段(PKey管理)、织物发现和物理视图、中央设备管理、监控、配置、织物健康、日志记录和高可用性。 此外,手册详细介绍了UFM的软件架构,包括图形用户界面、客户端API、客户端SDK工具、UFM服务器、子网管理器、NVIDIA可扩展层次聚合和还原协议(SHARP)聚合管理器、性能管理器、设备管理器、UFM开关代理和通信协议。文档还涵盖了UFM的安装和初始配置过程、历史遥测收集和UFM服务器软件的运行方式。

2024-01-10

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除