Python_金钱豹-CSDN博客

原创 RAG的2025趋势重点及RAG+抽取场景的来源定位问题思考

为什么在实际落地过程中，比如信息抽取、RAG 等，会有引文生成、来源定位这些需求？底层的逻辑是什么？有哪些实际的例子？在技术上如何做？

2025-06-24 21:15:05 419

原创 TTRL(Test-Time RL)微调新方法：极简版RL，效果吊打SFT

聚焦：提出的TTRL（Test-Time强化学习）给出了答案：*让AI自己生成答案，通过“投票”选出共识，再用共识作为奖励信号驱动学习。*

2025-06-24 20:47:13 625

原创多模态大模型中的视觉表征定律

本文在多模态大语言模型（MLLMs）中提出了"视觉表征定律"，揭示了跨模态对齐、视觉表征一致性及模型整体性能之间的强相关性。为量化这一关系，我们定义了跨模态对齐度（分数）与表征一致度（分数）两项指标。通过在15种不同视觉表征配置下的系统性实验，并结合8个基准测试的评估，我们发现分数与分数与模型性能呈现二次函数关系。基于这一规律，我们能够直接筛选并训练出最优视觉表征方案，在无需反复微调语言模型的情况下，实现计算成本降低99.7%的显著效果。

2025-06-24 20:45:37 739

原创 Tool-Star：赋予大模型结合多工具推理的能力

大型语言模型（LLMs）通过大规模强化学习（RL）展现了卓越的推理能力。然而，利用RL算法赋能LLMs进行有效的多工具协作推理仍然是一个开放性挑战。为了解决这一问题，我们提出了 Tool-Star ，一个基于强化学习的框架，旨在引导大模型逐步高效掌握调用多种工具的能力，从而提升其处理复杂推理任务的泛化性。我们的实验表明，Tool-Star框架能够在复杂计算型推理任务（AIME24、AIME25、MATH、MATH500等），以及知识型推理任务上（WebWalker、MuSiQue、Bamboogle等）同时

2025-06-23 21:15:16 924

原创一文搞懂大模型的智能体开发平台（FastGPT和Dify）

在大模型智能体快速发展的今天，FastGPT和Dify作为两个最具代表性的开源智能体开发平台。FastGPT专注于知识库问答和RAG场景的深度优化，而Dify则致力于构建基于LLM的Agent智能体应用程序，降低开发门槛，支持多种应用类型。

2025-06-23 21:11:20 621

原创颠覆传统奖励验证！抛弃第三方打分,大模型自证式推理训练法

一句话概括：穷哥们的强化学习指南——不用额外算力养裁判模型，靠参考答案的"自信即真理"也能弯道超车

2025-06-23 21:09:13 904

原创图提示在图学习模型中的应用：近期进展与未来方向

图学习模型在从大规模图数据中学习表达性表示方面展现了强大的能力，并在各种真实世界的应用场景中取得了显著成效。作为一种训练强大图学习模型的常见策略，"预训练、适应"方案首先以自监督方式在未标注的图数据上预训练图学习模型，然后将其适应于特定的下游任务。在适应阶段，图提示作为一种有前景的方法应运而生，它在保持预训练图学习模型不变的情况下，学习可训练的提示。在本文中，我们对图提示的最新进展进行了系统综述。首先，我们介绍了作为图提示基础步骤的代表性图预训练方法。接下来，我们回顾了图提示中的主流技术，并详细阐述了它们如

2025-06-22 10:45:00 560

原创 Graph-RAG全面综述：如何用知识图谱+大模型解决信息检索难题？

本文为《Graph Retrieval-Augmented Generation: A Survey》的深度精读，对论文内容进行了总结与提炼，希望帮助读者快速把握核心要点。在关键部分还附有拓展阅读建议，以引导进一步深入学习。由于部分内容基于基础概念之上展开，因此文中对相关基础知识有所略过。

2025-06-21 19:57:52 733

原创突破传统限制：AutoSchemaKG如何实现全自动知识图谱构建

我们提出了AutoSchemaKG，一个完全自主的知识图谱构建框架，无需预定义模式。我们的系统利用大型语言模型同时提取知识三元组和直接从文本中归纳全面的模式，对实体和事件进行建模，并在使用概念化将实例组织成语义类别的同时进行建模。处理超过5000万份文档后，我们构建了ATLAS（自动化三元链接和模式归纳），一系列拥有9亿多个节点和59亿多条边的知识图谱。这种方法在多跳问答任务上优于最先进的基线，并增强了大型语言模型的事实验实性。值得注意的是，我们的模式归纳实现了与人工制定的模式95%的语义对齐，且零手动干预

2025-06-21 19:55:14 402

原创清华：首个具身R1来了！协同框架下RL激活基座模型的视频空间推理能力，性能提升超10%！

受OpenAI-o1/o3、DeepSeek-R1等推理模型的启发，本论文提出了首个基于连续视觉感知的具身空间推理框架Embodied-R，通过强化学习（RL, Reinforcement Learning）和大小模型协同，将R1推理训练范式拓宽至具身智能领域。

2025-06-20 22:48:10 303

原创北航李伯虎院士任磊教授团队 | 工业大模型IFMsys架构，打造智能制造新范式

工业大模型已成为国内外产学研各界关注的前沿焦点方向。然而，工业大模型并不是通用大语言模型在工业的简单落地应用，其底层架构和应用逻辑存在本质差异。在李伯虎院士、国际建模仿真学会原主席张霖教授指导下，北京航空航天大学任磊教授带领青年教师和研究生自2022年起开始探索这一前沿方向，当前在《IEEE Transactions on Cybernetics》提出工业大模型体系架构IFMsys，提出工业大模型应用框架，并推出工业大模型原型系统MetaIndux。

2025-06-19 20:17:37 883

原创一网打尽：AI 大模型应用架构图终极合集

人工智能已然成为推动各行业变革的核心力量。而 AI 大模型，更是以其强大的通用性和适应性，开创了智能应用的新纪元。从精准营销到智能安防，从医疗诊断到工业制造，AI 大模型正深度融入各个领域，重塑行业生态。

2025-06-19 20:15:52 934

原创工业维护新趋势：生成式 AI 六阶段框架落地指南

生成式人工智能（AI）通过在故障中断生产之前识别故障、减少停机时间并优化资产性能，正在改变工业维护。传统的维护方法，无论是被动的、预防性的还是早期预测性的，往往缺乏精确性，导致不必要的维修、漏检和成本增加。

2025-06-19 20:14:13 991

原创 10min让你用Dify零代码搭建一个属于你的大模型知识库

通过学习能得到什么？可以得到一个简单的应用可以更深入了解大模型知识库的工作流大家有兴趣，可以跳到文末先看效果

2025-06-19 20:12:38 916

原创一键式训练端到端Agent，Qwen3+MCP工具集高效集成！

RLFactory能够让你通过低代码的方式快速训练你的端到端Agent模型，以Qwen3等最新的模型为基座调用你的MCP工具集！

2025-06-18 19:55:11 725

原创 RAG-MCP：通过检索增强生成和模型上下文协议增强AI代理

随着基础模型能力的提升，现实世界的应用需求日益增长，要求AI具备上下文感知、检索增强和代理驱动的特性。这正是RAG-MCP大放异彩的地方。

2025-06-18 19:53:35 773

原创本地私有化RAG知识库搭建心得总结

2025年2月，国内AI领域迎来现象级事件-DeepSeek突然全网爆红。引发指数级用户增长。面对激增的访问压力，平台服务器多次出现服务中断，"请求失败"的提示界面成为用户高频讨论话题，由此掀起了一场自建AI私有部署的热潮。

2025-06-18 19:52:00 914

原创 Agent也能蒸馏了！性能超好

大模型的困境：能力越强，成本越高！LLM 虽然能解数学题、答冷知识，但运行成本极高，好比“雇一个年薪百万的博士随时待命”。

2025-06-18 19:50:25 877

原创什么是AI Agents？什么是Agentic AI？他们有何不同？

目前，AI Agents 和 Agentic AI 是近年来备受瞩目的新兴概念。随着生成式人工智能模型（如 ChatGPT）的兴起，AI Agents 和 Agentic AI 的研究和应用迅速扩展。本文将详细探讨 AI Agents 和 Agentic AI 的定义、特性、架构、应用领域以及它们之间的区别，并提供一个专业的对比分析。

2025-06-17 20:36:15 780

原创 LLaMA Factory 微调教程：如何构建高质量数据集？

在开始学习之前，首先我们先补充演示一下，我们整体这次微调教程中，微调案例的一个最终效果。在本教程中，我们微调的基础模型是 Qwen2.5-7B-Instruct ，目标是微调后让其在特定场景下具备一定的推理能力，并且在 Web 安全领域具备专家级水准。

2025-06-17 20:34:41 789

原创无需标注和奖励模型！仅靠自信度RL，16个样本训练20步，效果飙升21%！

这篇论文提出了RLSC（基于自信心的强化学习），让大语言模型用自身答案的置信度作为奖励信号。就像学生通过检查自己的解题把握来提升成绩，完全摆脱对人类标注的依赖。

2025-06-17 20:31:34 603

原创新思路！如何在数据稀缺下构建高质量丰富数据集？

为什么微调之后，模型还是没学会新知识？在有限的数据场景下如何构建出更高质量、更丰富的数据集？

2025-06-16 21:17:47 1030

原创大模型公司挖墙脚哪家强？报告：Anthropic人才吸引力是OpenAI的8倍，留存率达80%

大模型公司挖墙脚哪家强，Anthropic才是最大赢家？不仅顶尖AI人才的留*存率达到80*%，而且工程师从OpenAI跳槽到Anthropic的可能性是从Anthropic转投OpenAI的8倍。

2025-06-16 21:13:17 854

原创遥感论文 | GRSM | ImageRAG：基于VLM和RAG的遥感图像上下文检索机制，有效解决遥感影像问答难题

超高分辨率（UHR）遥感影像（RSI）（例如10000×10000像素）对当前的遥感视觉语言模型（RSVLMs）提出了重大挑战。如果选择将超高分辨率图像调整为标准输入图像大小，其包含的大量空间和上下文信息将会被忽略。

2025-06-16 21:11:22 704

原创乖乖，太能打了！多模态融合目标检测新SOTA性能起飞！

为解决传统目标检测在复杂环境下效果不佳等问题，研究者们提出了多模态融合目标检测。通过整合来自多个传感器的数据，充分利用不同传感器的优点，多模态融合目标检测能够更全面地捕捉目标信息，显著提高检测的准确性和鲁棒性，以及模型在各种环境条件下的适应能力。

2025-06-15 10:45:00 905

原创 Nat Commun | DrBioRight 2.0：由大语言模型驱动的、进行癌症功能蛋白质组学分析的生物信息学聊天机器人

Nat Commun | DrBioRight 2.0：由大语言模型驱动的、进行癌症功能蛋白质组学分析的生物信息学聊天机器人

2025-06-14 10:45:00 734

原创迟来！解读Qwen开源的Embedding模型中的细节！附实测结果！

上周五，Qwen团队又开源了Embedding模型，真是人民需要什么，它开源什么呀！

2025-06-13 22:54:51 1088

原创 AI【简历评估】智能体：一个找“工作“的工作流

小伙伴，你很幸运！只要你能看完本期，你就解锁一个技术含金量很高的工作流。

2025-06-12 21:12:55 1016

原创 MCP 和 A2A 之后又一 AI Agent 协议刷屏了：AG-UI 协议架构设计剖析

随着 AI Agent 在企业中应用越来越广，AI Agent 在落地过程中，MCP 解决了 AI Agent 到 Tools 之间的通信标准，A2A 解决了 AI Agent 到 AI Agent 之间的通信标准。但是仍缺少一块：用户到 AI Agent 的通信协议。

2025-06-12 21:11:20 817

原创实战｜Spring +Milvus，Java也能实现的企业级文档问答RAG

在企业数字化转型的浪潮中，PDF、Word 等海量文档往往沉睡在各个业务系统中，形成“数据孤岛”，难以被智能系统高效利用。那么，如何构建一个真正面向企业场景落地的 AI 应用，让 AI 成为企业的“智能助手”？本项目提供一套基于 Spring 框架的完整解决方案，结合文档 ETL、向量检索与 RAG 问答技术，覆盖从数据导入到智能对话的全链路实践。

2025-06-12 21:07:38 638

原创 Agentic的模式和实现代码

这个是一个workflow的Agent 模式，一个 LLM 调用的输出依次进入下一个 LLM 调用的输入。这种模式将任务分解为一系列固定的步骤。每一步都由一个 LLM 调用处理前一步LLM处理的输出。这种模式适用于可清晰分解为可预测的顺序子任务的任务。

2025-06-11 19:42:27 619

原创 Qwen3模型架构、训练方法梳理

Dense 模型结构改进：GQA、SwiGLU、RoPE、RMSNorm with pre-normalization与Qwen2.5 相似。移除了 Qwen2 中的移除QKV偏置，减少模型复杂性，在注意力机制中引入 QK-Norm 来确保稳定训练。

2025-06-11 19:40:26 1207

原创 RAG新选择！阿里开源向量大模型Qwen-Embedding和重排序大模型，评分超谷歌向量模型，检索排行榜第一！完全免费开源

阿里巴巴Qwen团队发布了全新的Qwen3 Embedding系列模型，这是一套基于Qwen3基础模型构建的专用文本向量与重排（Reranking）模型。该系列模型凭借Qwen3强大的多语言理解能力，在多项文本向量与重排任务的Benchmark上达到了SOTA水平，其中8B尺寸的向量模型在MTEB多语言排行榜上排名第一。Qwen3 Reranker模型在多个评测基准上同样大幅超越了现有的主流开源竞品。

2025-06-11 19:38:47 830

原创 ICML 2025 | 无需训练，即时对齐大模型偏好

为了让大模型（LLM）的行为更符合人类预期，一系列训练时对齐方法（例如RLHF和DPO）通过微调模型参数来实现偏好优化。然而，这种“训练时对齐”模式不仅耗时耗力，而且一旦偏好发生变化（比如安全标准更新），就得从头开始再训练一次。这种方式在应对变化需求时显得十分被动。

2025-06-11 19:37:10 868

原创 DeepSeek基础：模型预训练概念与技术详解

预训练技术的本质是让AI先建立语言世界的“通用知识地图”，再通过少量标注快速定位“任务目的地”。这种范式突破使得AI首次展现出接近人类的语言理解和创造能力。本文将从以下方面介绍：

2025-06-10 20:22:26 1104

原创【大模型基座】Qwen3技术报告发布

模型架构：Qwen3系列包括6个密集模型（Qwen3-0.6B到Qwen3-32B）和2个MoE模型（Qwen3-30B-A3B和Qwen3-235B-A22B）。这些模型的架构类似于Qwen2.5，但进行了优化和改进，包括使用GroupedQueryAttention、SwiGLU、Rotary Positional Embeddings和RMSNorm等。

2025-06-10 20:20:44 1046

原创多模态数据融合又冲上Nature！确定不来了解一下？

众所周知，多模态在如今是越发的火爆了，而多模态数据融合作为其中的关键技术，自然也就成为研究的热门！且还在上升期，出创新点的机会很多。主要在于，其能够整合来自不同模态的数据，减少单一数据源可能带来的误差和不确定性，从而提高信息处理的准确性和可靠性。此外，不同模态的数据还可能受到不同的噪声和干扰，通过融合，有助于模型摒除干扰，提高鲁棒性。这些特性对于医疗诊断、自动驾驶、人机交互等都至关重要！

2025-06-10 20:18:47 754

原创理解 RAG 第三部分：融合检索与重新排序

我们之前介绍了什么是 RAG、它在大型语言模型 (LLM) 中的重要性，以及 RAG 的经典检索器、生成器系统是什么样的，本系列的第三篇文章探讨了一种构建 RAG 系统的升级方法：融合检索。

2025-06-10 20:17:10 766

原创 SFT+RL双阶训练突破LLM自我监督！人大DeepCritic实现AI批判自主进化

大语言模型（LLM）通过大规模地学习人类数据并从人类监督反馈中不断进化，在许多任务上展现出卓越的性能。然而，随着模型智能的不断增强，依赖人工监督的方式也面临着越来越高饿成本和难度。如何以更高效、可扩展的方式对日益进化的模型进行监督，成为非常重要且亟待解决的关键问题。

2025-06-09 20:51:12 816

原创开源大模型网关：One API实现主流AI模型API的统一管理与分发

One API是一个使用go语言开发的大语言模型 API 管理与分发系统支持Docker一键快速部署，且资源占用小，高性能开箱支持多平台大模型快速接入，包括OpenAI、Gemini、xAI、Grop、Anthropic Claude、Ollama、Deepseek、智谱AI、豆包、文心一言等等

2025-06-09 20:48:52 902

空空如也

空空如也