自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(918)
  • 收藏
  • 关注

原创 大模型的训练与应用 | 二十二、DeepSeek API 申请与使用指南

AI大模型作为人工智能领域的重要技术突破,正成为推动各行各业创新和转型的关键力量。抓住AI大模型的风口,掌握AI大模型的知识和技能将变得越来越重要。学习AI大模型是一个系统的过程,需要从基础开始,逐步深入到更高级的技术。这里给大家精心整理了一份全面的AI大模型学习资源,包括:AI大模型全套学习路线图(从入门到实战)、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频,免费分享!

2024-08-01 15:13:51 21055 1

原创 大模型论文 | RAKG:文档级检索增强知识图谱构建

的本体框架与模式约束,实现了有限领域的高精度知识抽取,但其高昂的维护成本与僵化的知识表示方式难以应对开放域文本的动态性与语义多样性。近年来,深度学习技术的突破为自动化知识图谱构建注入了新动力。在命名实体识别(Named Entity Recognition,NER)领域,研究范式经历了从规则驱动到数据驱动的转变。

2025-05-06 17:36:40 630

原创 2025零基础入门大模型!完整系统的大模型学习路线指南(非常详细)看这一篇就够了!

对于零基础或者是自学者来说,学习AI大模型确实可能会感到无从下手,这时候一份完整的、系统的大模型学习路线图显得尤为重要。它可以极大地帮助你规划学习过程、明确学习目标和步骤,从而更高效地掌握所需的知识和技能。下面给大家分享一份2025最新版的大模型学习路线,帮助新人小白更系统、更快速的学习大模型!保证100%免费。

2025-05-05 19:49:59 848

原创 大模型入门指南:模型训练(Training)全解析!看这一篇就够了!

Training(模型训练)本质是AI世界的‘科学烹饪实验’——以数据为食材原料,用超参数作配方比例,借验证集做品控质检,将‘玄学炼丹’的试错过程,淬炼成‘可复现的精密工程’。今天用最通俗的话,带你拆解模型训练(Training)全过程。

2025-05-04 08:15:00 891

原创 深度解析Agent实现(四)自主化演进、多Agent、MCP

看了许多关于人工智能的学术文章与技术论文之后, 深切体会到,唯有将这些理论付诸实践,将其转化为文字和具体的代码,才能真正感受到当下大型语言模型(LLM)所蕴含的非凡魅力,这种从认识到实践的过程,不仅加深了技术理解,更是一场思想深度对话,Agent相关的研究还有很多,希望这篇文章对大家有帮助。

2025-05-03 07:45:00 566

原创 深度解析Agent实现(三)几个场景的实验

看了许多关于人工智能的学术文章与技术论文之后, 深切体会到,唯有将这些理论付诸实践,将其转化为文字和具体的代码,才能真正感受到当下大型语言模型(LLM)所蕴含的非凡魅力,这种从认识到实践的过程,不仅加深了技术理解,更是一场思想深度对话,Agent相关的研究还有很多,希望这篇文章对大家有帮助。

2025-05-02 04:30:00 739

原创 深度解析Agent实现(二)LLM、Memory、Tools、Planning、Agent、Prompt

接下来围绕Agent几个核心要素进行设计,会先简单介绍一些基本的原理,然后基于OpenManus做二次设计或者展示其原来的实现。

2025-05-01 08:45:00 1018

原创 深度解析Agent实现(一)AI Agent的核心要素

AI Agent将使软件架构的范式从面向过程迁移到面向目标,就像传统面向过程的工作流和K8S的声明式设计模式一样, 当然这两种解决的问题是不一样的, K8s通过定义期望状态而非具体步骤来管理集群,降低集群状态管理的复杂度,确保集群的稳定性和容错性。Agent之前,传统的软件架构,只能解决有限范围的任务, 而基于Agent的架构,可以解决无限域的任务,真正意义上的个性化服务。我们可以从Manus的官方网站看到,Manus宣称可以做如下的事情,并提供了相当丰富的案例。

2025-04-30 19:45:00 557

原创 RAG检索增强生成 | 一文深入剖析RAG的原理

RAG作为AI精准回答的“密钥”,其效果高度依赖于文档处理的质量。杂乱无章的知识库只会让AI“越帮越忙”,而结构化、高质量的文档则能让RAG如鱼得水。无论是企业还是开发者,通过统一文档格式、精炼内容、构建结构化知识库等方法,都能显著提升RAG的实用价值。

2025-04-30 15:24:16 878

原创 Github超过46.9k Star的神书《从零构建大模型》(附中英文版PDF)

在《从零构建大模型》这本书中,你将逐步了解大语言模型(LLMs)如何从内到外工作,自己动手编写代码,逐步构建一个LLM。在这本书中,将通过清晰的文字、图示和示例,带您完成构建自己LLM的每一个阶段。《从零构建大模型》本书描述的训练和开发自己的小型功能性模型的方法,旨在教育用途,类似于用于创建大规模基础模型(如ChatGPT背后的模型)的方法。此外,本书还包括加载更大预训练模型权重进行微调的代码。

2025-04-30 09:15:00 233

原创 大模型入门指南,小白也能看懂的“训练存档”全解析

刚接触大模型论文时,看到满屏的“CheckPoint”是不是瞬间头大?别慌!其实它就像游戏里的自动存档——关键时刻能救你“命”,还能让模型“越练越聪明”。今天用最通俗的话,带你拆解CheckPoint(检查点)如何实现模型“训练存档”。

2025-04-29 11:03:05 748

原创 Anthropic公司最新研究方法揭示Claude价值取向

总之,Anthropic这项《Values in the Wild》[3]研究首次提供了大规模的AI价值观实证图谱,揭示了Claude在现实对话中的价值表达方式。研究发现,Claude的多数价值观表现与设计目标一致,在不同场景下能够灵活调整,并且对用户的价值观通常是支持或共鸣的。当遇到明显不当的请求时,它也会启用道德机制进行抵制。这些成果为未来。

2025-04-29 10:22:07 758

原创 大模型论文 | NotebookLM:基于RAG的协作式AI辅导、MLRC-BENCH:评估语言智能体解决机器学习研究挑战的能力

1、 NotebookLM:基于RAG的协作式AI辅导2、 MLRC-BENCH:评估语言智能体解决机器学习研究挑战的能力谷歌研究表明,NotebookLM通过检索增强生成(RAG)技术,能够作为可靠的AI物理辅导员,通过教师提供的文档为答案提供事实基础,促进协作学习。研究发现:(1)RAG技术大幅提高了事实准确性,使LLM在辅导中更加可靠(2)"训练手册"有效引导AI进行苏格拉底式对话,在教学法上对其进行约束(3)在图表解释等多模态任务中,Google Docs比PDF格式表现更佳。

2025-04-29 08:00:00 1016

原创 大模型论文 | SplitReason:让小模型也能高效完成复杂推理,OTC:优化工具调用的强化学习框架

1、SplitReason:让小模型也能高效完成复杂推理2、 OTC:优化工具调用的强化学习框架3、 Lumos:大规模LLM训练性能建模与估算通过仅将5%的推理过程外包给大模型,SplitReason使小型模型的推理准确率提高了28.3%,同时推理速度提升4-6倍。核心思想是让小模型学会识别推理过程中的"难点",并仅在必要时向大模型求助。研究团队在18,000条推理轨迹上进行监督微调,使1.5B参数的小模型能够通过发出特殊标记和精确控制何时向32B参数的大模型寻求帮助。

2025-04-28 11:55:52 701

原创 RAG从入门到精通(二)代理型 RAG 与(普通)RAG 的对比、实现代理型 RAG

然而,任何事物都有两面性。具有功能调用的语言模型提供了一种构建代理系统的方法,通过允许模型与预定义工具交互。行业分析主要包括对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。在你已经掌握了大模型技术之后,就需要开始准备面试,我们将提供精心整理的大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余。书籍和学习文档资料是学习大模型过程中必不可少的,我们精选了一系列深入探讨大模型技术的书籍和学习文档,

2025-04-25 20:08:22 576

原创 RAG从入门到精通(一)什么是检索增强生成(RAG)

最近总听说RAG,RAG到底是什么呢?本文将向你介绍代理型 RAG 的概念、实施方法,以及其优势与局限性。

2025-04-25 20:06:32 791

原创 大模型可视化 | 什么是Open WebUI?Open WebUI + vLLM如何实现DeepSeek本地部署并可视化?

Open WebUI 是一个开源的、可扩展且用户友好的自托管 AI 平台,专为生成式人工智能模型交互而设计。Open WebUI旨在为用户提供一个简单易用、功能强大且高度定制化的界面,使其能够轻松与各种 AI 模型(如文本生成、图像生成、语音识别等)进行交互。提供类似 ChatGPT 的自然语言对话界面,支持Markdown 格式渲染(如加粗、列表、代码块等)和代码高亮显示,提升内容可读性。内置对话历史记录功能,用户可随时回顾上下文,避免重复输入,确保对话连贯性。

2025-04-22 19:28:13 925

原创 OpenAI正式发布两款全新的推理模型:o3与o4-mini

与。这两款模型不仅在多模态推理、工具整合和视觉理解方面实现了重大飞跃,更代表了AI技术从语言理解向多模态感知与推理的深度演进。

2025-04-21 16:57:31 685

原创 2025年自学AI大模型从入门到精通,千万别学反了!(附最新大模型学习路线)

初识大模型OpenAI模型的发展历程主流国产大模型大模型赋能行业分析未来展望:大模型的趋势与挑战。

2025-04-17 17:15:05 696

原创 大模型推理机制 | 大型语言模型(LLM)到底是怎么“思考”你的问题?

现在你知道了,AI不是魔法,而是一套精密的推理机制:它像一个认真思考的学生,每次都要“从头再读一遍”,才能生成合乎逻辑的新答案。你也明白了,Token不是一个虚无缥缈的单位,而是影响速度、成本、效果的关键所在。更重要的是——

2025-04-15 14:07:28 515

原创 大模型推理 | 什么是FastAPI?为什么选择FastAPI构建推理服务?为什么需要推理服务?FastAPI如何构建大模型推理服务?

FastAPI 是一个现代的、快速(高性能)的 Web 框架,专为构建基于 Python 的 API 服务而设计。FastAPI结合了异步编程、自动数据验证和类型安全的特性,使得开发高性能、可扩展的 API 变得简单高效。构建 RESTful API:适合开发需要高性能和类型安全的 API 服务。微服务架构:作为微服务的一部分,提供高效的接口。机器学习推理服务:结合大模型(如 Hugging Face Transformers)构建推理 API。

2025-04-15 13:46:41 974

原创 MCP从入门到精通(三)MCP Server 开发实践

MCP (Model Context Protocol) 代表了 AI 与外部工具和数据交互的标准建立。MCP 的本质:它是一个统一的协议标准,使 AI 模型能够以一致的方式连接各种数据源和工具,类似于 AI 世界的"USB-C"接口。MCP 的价值:它解决了传统 function call 的平台依赖问题,提供了更统一、开放、安全、灵活的工具调用机制,让用户和开发者都能从中受益。使用与开发:对于普通用户,MCP 提供了丰富的现成工具,用户可以在不了解任何技术细节的情况下使用;

2025-04-14 15:35:36 1011

原创 MCP从入门到精通(二)MCP原理解析

MCP的诞生标志着prompt engineering进入了一个新的发展阶段,它通过提供更结构化的上下文信息,显著提升了模型的能力。在设计prompt时,我们的目标是能够将更加具体的信息(如本地文件、数据库内容或网络实时数据等)集成进来,从而使模型能够更好地理解和解决实际问题。回顾没有 MCP 的时代,为了解决复杂问题,我们不得不手动从数据库中筛选信息或使用工具来检索相关信息,并将其逐一添加到 prompt 中。

2025-04-14 15:21:23 683

原创 MCP从入门到精通(一)MCP是什么?为什么需要 MCP 呢?

MCP (Model Context Protocol) 代表了 AI 与外部工具和数据交互的标准建立。通过本文,我们可以了解到MCP的本质、价值、使用与开发。

2025-04-14 14:44:29 804

原创 深度剖析基于MCP实现AI应用架构设计新范式(四)AI 应用架构设计新范式对企业的影响

运维团队:负责云产品的维护(比如:云原生 API 网关、Nacos、Serverless 应用引擎、PAI 等产品的开通和升配),以及可观测体系的维护。运维团队还将与云厂商保持持续沟通,确保系统的稳定运行。研发团队:专注于理解公司业务的原子化能力,负责构建 MCP Server 池。研发团队将更加专注于后端服务的开发和优化,而无需过多关注前端展示逻辑。运营/市场/产品团队:通过低代码可视化方式构建业务流程(业务编排),用大白话描述业务需求,快速完成业务流程的搭建或 AI 应用的构建。

2025-04-13 11:00:00 1023

原创 深度剖析基于MCP实现AI应用架构设计新范式(三)AI 应用架构设计新范式

一个云原生 API 网关三种角色,具备统一的管控底座,同时又实现各角色的协同调度。Nacos 发挥注册中心优势,增加 MCP Server 的注册能力,实现普通服务和 MCP Server 的统一管理,结合网关实现现存业务0改造转换为 MCP Server。

2025-04-13 07:00:00 1018

原创 深度剖析基于MCP实现AI应用架构设计新范式(二)MCP 架构设计剖析

MCP(模型上下文协议,Model Context Protocol)是由Anthropic(Claude 的开发公司)开发的开源协议,旨在为大语言模型(LLM)提供一种标准化的方式,以便它们能够连接到外部数据源和工具。它就像是 AI 应用的“通用接口”,帮助开发者构建更灵活、更具上下文感知能力的 AI 应用,而无需为每个 AI 模型和外部系统组合进行定制集成。MCP 的设计理念类似于 USB-C 端口,允许 AI 应用以一致的方式连接到各种数据源和工具,如文件、数据库、API 等。

2025-04-12 11:56:22 709

原创 深度剖析基于MCP实现AI应用架构设计新范式(一)AI Agent 现状与架构

行业分析主要包括对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。在你已经掌握了大模型技术之后,就需要开始准备面试,我们将提供精心整理的大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余。书籍和学习文档资料是学习大模型过程中必不可少的,我们精选了一系列深入探讨大模型技术的书籍和学习文档,学习AI大模型是一个系统的过程,需要从基础开始,逐步深入到更高级的技术。要学习一门新的技术,作为新手一定要。

2025-04-12 11:48:19 650

原创 零基础小白LLM入门指南 | Tokens、Transformer、Self Attention、FFN和Softmax

在自然语言处理(NLP)中,模型在处理大规模数据时,如果将其分割成小块,会更容易处理。因此,

2025-04-11 18:57:40 700

原创 智能体 | 谷歌Agent2Agent (A2A) 和 MCP的区别、使用场景与代码示例

A2A 和 MCP 都是旨在增强智能体功能的协议,但它们解决的是智能体生态系统中的不同挑战。MCP 由 Anthropic 开发,是一个开放协议,标准化了智能体或大型语言模型 (LLM) 如何访问外部工具、数据源和服务。它充当桥梁,使智能体能够执行超出其内置能力的操作,例如获取实时数据、与 API 交互或执行代码。这对于无需为每个工具定制集成的动态工具使用特别有用。另一方面,A2A 是谷歌于 2025 年 4 月 8 日推出的较新开放协议,旨在实现不同智能体之间的互操作性。

2025-04-11 17:37:58 805

原创 最新开源 | 大型中文高质量偏好数据集-COIG-P

今天给大家分享一个大型中文高质量偏好数据集-COIG-P。整个偏好数据集总量为 1006 K,涉及 92K 个 Query,从多个中文问答平台收集,包括对话、逻辑推理、数学、小说续写、角色扮演和代码等6个领域。整个数据收集和清理工作如上图所示,数据源主要来自百度知道、知乎、百度贴吧、中文行政能力测试,还将一些英文开源数据集的Query翻译成中文。通过去重和过滤保证Query的质量,使用SentenceBERT获取Query的句向量,删除语义相似度高的Query,以确保多样性。

2025-04-10 12:01:39 509

原创 一文搞懂大模型文本到SQL | Text2SQL数据集、Text2SQL技术实现

Text2SQL数据集是指一类专门用于训练Text2SQL(文本到SQL)模型的数据集合。Text2SQL数据集通常包含大量的自然语言查询(如问题或指令)和对应的SQL查询语句。这些对构成了模型学习的基础,使模型能够学会将自然语言查询转换为SQL查询。

2025-04-10 11:30:32 884

原创 企业如何部署大模型?一文总结7种部署大模型的方式和框架

个人开发者:优先使用Ollama(零配置)或Transformers(灵活)。企业高并发场景:选择vLLM(吞吐量)或SGLang(结构化输出)。边缘计算/实时交互:LMDeploy的低延迟特性最佳。分布式需求:DeepSpeed和ModelScope支持多节点扩展。通过合理选择框架,开发者可最大化发挥大模型的性能潜力。建议结合业务需求参考官方文档调整参数,并监控GPU显存与吞吐量指标。

2025-04-09 13:59:56 856

原创 大模型论文 | EDC²-RAG:利用聚类和压缩技术提升RAG准确性

确保最终输入到模型中的信息既相关又高效。通过这种方式,EDC²-RAG 不仅减少了 LLMs 的计算负担,还提高了生成答案的准确性和一致性。实验表明,EDC²-RAG 在多个数据集上均取得了显著的性能提升,尤其是在处理噪声和冗余内容时表现出色。这种技术为大语言模型的进一步应用提供了新的方向,特别是在需要处理大规模外部知识的场景中。

2025-04-08 17:30:00 590

原创 大模型 | 深入剖析Llama 4的MoE 架构、Llama 4 的 MoE 架构与传统 Dense 模型的效率对比

Llama 4 系列目前推出了 Scout 和 Maverick 两个版本,它们在架构设计上各具特色,但都围绕着 MoE 架构展开。

2025-04-08 13:01:24 928

原创 2025技术进阶 | 程序员如何系统的入门大模型?

因此普通程序员研究大模型,不妨选择从外到内的思路,从套壳应用,再了解部署、微调和训练。

2025-04-07 14:54:48 868

原创 Llama4发布!开启超高性价比原生多模态AI和开源MoE的新时代

Llama团队发布了。

2025-04-07 11:15:12 621

原创 大模型论文 | Anthropic发现:推理模型不会完全“说出“它们的思考过程

你是否曾经幻想过,随着AI大模型的发展,我们终于可以通过观察它们的"思考过程"来确保安全了?毕竟,当Claude、GPT等AI展示思维链(Chain-of-Thought,简称CoT)时,我们仿佛能看到它们脑中的运转机制,确保它们不会悄悄做坏事…。换句话说,AI模型可能正在"思考一套,说一套"。该研究对两款顶级推理模型——和进行了系统测试,探究它们的思维链是否忠实反映真实思考过程。研究团队设计了一个巧妙的评估方法:1.首先准备一套标准多选题作为"无提示"问题。

2025-04-07 10:39:54 603

原创 大模型论文 | TAU-Bench、Thinking Intervention、LLM高效推理的综述、Open-Qwen2VL

是一个评估AI智能体在真实世界环境中可靠性的基准测试。它评估智能体是否能够在动态的多轮对话中与用户进行交互,理解需求并完成任务。虽然该基准测试于2024年6月发布,但现在感觉比以往任何时候都更重要。它不仅描述了我们目前面临的限制,还展示了如何为自己的智能体设置良好的评估流程!论文标题:τ-bench: A Benchmark for Tool-Agent-User Interaction in Real-World Domains。

2025-04-06 09:00:00 1919

原创 大型语言模型LLM | 大模型推理框架特点及应用场景汇总!

大型语言模型(LLM)已成为驱动智能客服、内容创作、代码生成等领域变革的核心力量。推理框架作为LLM高效部署的关键组件,直接关系到应用的性能、成本和开发效率。本文罗列常用大模型框架的特点,以供实际应用需要!

2025-04-05 09:00:00 1747

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除