大模型教程.-CSDN博客

原创 DeepSeek超全使用指南（2025最新版）-从入门到精通

在AI工具井喷的2025年，DeepSeek凭借其强大的中文理解能力和场景化解决方案，成为职场人、创作者和开发者的效率神器。本文将手把手教你解锁DeepSeek的全部潜能，让你的生产力实现指数级飞跃。DeepSeek R1正式入驻Azure AI Studio，成为首个直连全球GPU资源池的中国大模型。这记重拳直接击碎"东西方AI生态隔离"的幻想——当华盛顿还在讨论技术封锁法案时，中国AI已用代码轰开微软帝国的大门，聪明的中国用户早已用DeepSeek写完周报、搞定投标书、甚至生成年会相声剧本。

2025-02-06 10:31:45 51506 2

原创 DeepSeek 超全面指南！入门 DeepSeek 必看

最近，AI界出现了一匹黑马——DeepSeek。这个名字可能对很多人来说还比较陌生，但它已经在全球范围内引发了巨大的关注，甚至让一些科技巨头感到了压力。今天，就让我们一起走进DeepSeek的世界，看看它到底有多厉害！DeepSeek（中文名：深度求索）是一款由杭州深度求索人工智能基础技术研究有限公司开发的人工智能模型。它的英文名“DeepSeek”可以读作“深思”（Deep）和“探索”（Seek），寓意着通过深度学习技术探索未知的领域。

2025-02-04 13:38:35 356410 3

原创论文解读：最近爆火的Google Gemini模型——AI新时代的先锋，重新定义多模态智能

在AI技术日新月异的2025年，Google DeepMind重磅推出Gemini模型家族，掀起了一场多模态AI的革命风暴！从文本到图像、音频、视频，Gemini不仅在单一领域独领风骚，更以跨模态的超强推理能力，刷新了30项技术前沿，成为AI领域的“全能选手”。尤其令人振奋的是，Gemini Ultra成为首个在MMLU考试基准上超越人类专家的模型，准确率高达90.04%！这不仅是一次技术突破，更预示着AI在教育、编程、翻译等领域的无限可能。为了系统了解Gemini的技术突破，本文基于2023年谷歌团队公开

2025-05-30 10:33:54 592

原创一文讲清楚大模型蒸馏技术的演进历史与实现原理

在深度学习领域模型的压缩与部署是一项非常重要的研究课题，原因就在于模型巨大的成本和算力需求；因此，怎么把模型小型化就成为一个亟待解决的问题。

2025-05-30 10:29:56 376

原创【DeepSeek本地知识库部署】Dify+DeepSeek实现智能体工作流，喂饭级教程，强烈建议收藏

Ollama 是一个用于本地运行大语言模型（LLMs）的开源工具，提供简单的界面和优化的推理引擎，使用户能够在个人设备上高效地加载、管理和运行 AI 模型，而无需依赖云端。

2025-05-30 10:25:04 313

原创清华大学 | 《关于人工智能大模型的几点思考》71页PDF，免费下载

《关于人工智能大模型的几点思考-清华大学·郑纬民》探讨了人工智能大模型的发展现状、技术创新及其在各行业的应用，强调了构建国产智算系统和优化大模型训练与推理的重要性。首先概述了人工智能大模型的背景和发展趋势，然后详细讨论了2025年AI大模型的两个主要特点，接着介绍了人工智能大模型生命周期的五个环节，包括数据获取、数据预处理、模型训练、模型微调和模型推理。随后，重点阐述了构建国产智算系统的核心基础软件，包括并行系统、编程框架、通信库、AI编译器、算子库、编程语言、内存管理、容错系统和存储系统。最后，总结

2025-05-29 10:52:20 245

原创一文带你搞懂什么是智能体（AI Agent）

广义上，智能体（Agent）在人工智能领域中指的是一种能够感知环境并根据感知到的信息作出决策和行动的代理体。它可以是软件、硬件或一个系统，具备自主性、适应性和交互能力。

2025-05-29 10:48:34 660

原创【Coze实战】10分钟DIY专属AI，长文秒变导图，打通你的知识任督二脉！

你是否也曾有过这样的体验，面对堆积如山的学习资料、冗长枯燥的会议纪要、或是密密麻麻的项目文档，还没开始整理就先感到一阵头大？信息爆炸的时代，我们每天都在被各种文字内容轰炸，如何在海量信息中快速提炼核心要点，让知识变得条理清晰、一目了然，这几乎成了困扰每个人的难题。

2025-05-29 10:42:17 425

原创 n8n：从零搭建第一个自动化流：Webhook监听+数据处理全流程解析

n8n 是一个开源的低代码工作流自动化工具，常用于将不同的服务和工具连接起来，完成自动化操作。它的名字源自 “nodemation”（node + automation）。

2025-05-28 12:12:08 923

原创一文揭秘 AI 大模型落地的四大核心技术：蒸馏、量化、MoE 与 MHA

在当今数字化时代，AI 大模型的应用范围不断拓展，从智能客服到医疗诊断，从图像识别到智能驾驶，大模型正以前所未有的速度改变着我们的生活和工作方式。然而，随着应用场景的日益复杂和多样化，AI 大模型在落地过程中面临着诸多挑战，如模型部署成本高、推理速度慢、资源消耗大等问题。为了克服这些难题，研究人员和工程师们不断探索和创新，提出了一系列先进的技术解决方案。本文将聚焦于蒸馏、量化、MoE（混合专家模型）、MHA（多头注意力机制）这四大核心技术，深入剖析它们的原理、优势以及在实际应用中的成功案例，带你领略 AI

2025-05-28 12:06:30 832

原创中邮证券《MCP开启智能体新时代》（免费下载PDF版本）

该报告由中邮证券研究所发布，聚焦AI Agent的规模化落地及MCP协议对行业生态的重塑作用。

2025-05-28 11:58:25 987

原创三大行业案例：AI大模型+Agent实践全景

本文将从AI Agent和大模型的发展背景切入，结合51Talk、哈啰出行以及B站三个各具特色的行业案例，带你一窥事件驱动架构、RAG技术、人机协作流程，以及一整套行之有效的实操方法。具体包含内容有：51Talk如何让智能客服“主动进攻”，带来约课率、出席率双提升；哈啰出行如何由Copilot模式升级为Agent模式，并应用到客服、营销策略生成等多个业务场景；B站又是如何借力大模型与RAG方法，引爆了平台的高效内容检索和强互动用户体验。

2025-05-28 11:53:27 598

原创大模型及DeepSeek在运维场景中的应用2025（附PDF下载）

该报告聚焦大模型与 DeepSeek 在运维领域的创新实践。指出大模型作为新质生产力，可推动智能运维迈向 L5 级系统自治阶段，以 “自然语言” 交互实现人机协同运维。通过故障分析、根因定位、日志解读等场景案例，展示其在快速处理海量运维数据、降低人为判断误差上的显著优势。同时直面挑战，分析模型推理效率、“幻觉” 问题对落地的阻碍，提出异步调度、多智能体协作等优化方案。此外，结合力维智联 Crete 动环智能运维大模型与 DeepSeek 的融合应用，以自动化问答准确率超 90% 等数据，验证其在实际场景中的

2025-05-27 11:20:37 757

原创超干货！Coze工作流案例分享，一键生成爆火育儿视频！（附完整代码提示词）

该阶段让大家对大模型 AI有一个最前沿的认识，对大模型 AI 的理解超过 95% 的人，可以在相关讨论时发表高级、不跟风、又接地气的见解，别人只会和 AI 聊天，而你能调教 AI，并能用代码将大模型和业务衔接。（4）分割段落，生成文案后，首先按照中文句号，分割文案，可以直接用文本处理插件，但文本处理插件有个问题，分割之后的文案列表，很容易出现空的元素。对全球大模型从性能、吞吐量、成本等方面有一定的认知，可以在云端和本地等多种环境下部署大模型，找到适合自己的项目/创业方向，做一名被 AI 武装的产品经理。

2025-05-27 11:17:32 936

原创一个插件，免费使用所有顶级大模型(Claude、Gemini、Grok、GPT、Deepseek)

还在为使用顶级大模型要付费而发愁？今天给大家介绍一款集成于浏览器侧边栏的免费AI对话插件——DeepSider ，堪称 “白嫖党” 的福音。

2025-05-27 11:11:29 924

原创 LangChain是什么，LangChain综述！一文详解LangChain的原理和运用

LangChain 是一个开源框架，于 2022 年 10 月由 Harrison Chase 推出，旨在助力开发者高效构建基于大语言模型（LLM）的应用程序。在大语言模型飞速发展的当下，虽然模型本身具备强大的自然语言处理能力，但将其有效应用于实际场景面临诸多挑战，例如与外部数据源集成、管理对话上下文、构建复杂的交互流程等。LangChain 应运而生，填补了从模型到应用之间的空白，极大地降低了开发门槛，成为 LLM 开发领域最受欢迎的框架之一。

2025-05-27 11:02:35 734

原创 99%的人都应该看看这本书，精简小册子让你快速跨入大模型的世界（附PDF下载）

《大模型应用开发极简入门》这本书是面向想要快速了解大模型（如GPT-4、ChatGPT）并直接开始应用开发的读者量身打造的。书中的内容通俗易懂、结构清晰，从基础概念到实际应用案例都有详尽讲解，非常适合初学者阅读。

2025-05-26 11:28:58 853

原创一文详解大模型热门概念：AI Agent、RAG...

如果最近有关注科技新闻，一定会被一款名为 Manus 的AI Agent刷屏。Manus一经发布，就引起广泛关注，内测资格甚至一度被炒至高价。到底什么是AI Agent？AI Agent与大模型又是什么关系？

2025-05-26 11:18:11 714

原创零基础！扣子（coze）工作流搭建入门教程【手把手教会】

简单来说，工作流就是一套“流水线操作指南”。就像我们做菜的流程一样：先洗菜→切菜→开火→倒油→炒菜→放调料→出锅每一步按顺序来，最后菜出锅不好吃是哪一步出了问题，今天的菜非常好吃，又是哪一步进行了优化，明明白白。这就是工作流的魅力——把复杂的事情拆成简单的小步骤，让不同的人或者工具都能高效配合。

2025-05-26 11:07:14 978

原创为什么大厂都在用LangChain？一文拆解大模型应用主流开发框架！

本文主要从Why、What、How的角度，拆解目前主流的大模型应用开发框架LangChain，之后给到一个带RAG能力的聊天机器人（Chatbot）项目，来感受下LangChain在大模型应用开发方面的实战效果。

2025-05-26 11:00:30 1533

原创一文详解十款主流LLM应用框架：LangChain、Dify、LlamaIndex....

随着大型语言模型（LLM）的普及，开发者们需要强大的框架来快速构建智能应用。从聊天机器人到知识库搜索，市场上有许多工具可以简化开发流程。本文将比较十款主流开源框架：LangChain、Dify、LlamaIndex、Haystack、Flowise、Langflow、CrewAI、AutoGPT、n8n 和 MaxKB，帮助你选择最适合项目的工具。

2025-05-24 11:49:13 851

原创【Dify入门系列】详解各种工作流节点，如何降低LLM开发门槛？

在Dify处于0.x版本的去年，我曾有过一段时间的使用经历。和许多技术爱好者一样，由于工作上的变动，我不得不暂时将其搁置。最近，我收到了不少读者的咨询：“Dify如今发展到何种程度了？是否还值得投入精力去学习？”怀揣着这些疑问，我再次对Dify进行审视，发现它已升级至1.x版本，正从一个“有趣的玩具”逐步向“生产级工具”转变。我打算对其展开深入研究，并计划撰写一个系列文章，内容将从基础使用逐步延伸至核心原理，最后到个性化定制开发。今天，先为大家带来关于Dify的全面介绍！

2025-05-24 11:42:47 758

原创【资料分享】《AI大模型基础》教材完整版（附290页文件下载）

《AI大模型基础》是一本系统全面介绍大语言模型基础理论、架构、应用与调优的专业教材，由多位专家倾力打造，以通俗易懂的语言和详实的案例，为读者呈现大语言模型的全景图。

2025-05-24 11:08:40 695

原创手把手带你从零预训练一个自己的大模型（完整代码）

大语言模型（Large Language Model，简称LLM），指使用大量文本数据训练的深度学习模型，可以生成自然语言文本或理解语言文本的含义。

2025-05-24 11:04:28 656

原创一文读懂：AI大模型分布式训练并行技术

近年来，随着Transformer、MOE架构的提出，深度学习模型的参数量级已快速攀升至十万亿级别，传统单机单卡的训练范式在超大规模模型面前显得捉襟见肘。

2025-05-23 11:37:24 627

原创一文讲清楚AI大模型三种模式：Agent、copilot、embedding

今天来和大家讲讲AI大模型的三种模式：agent、copilot、embedding

2025-05-23 11:22:52 985

原创手把手带你用BotSharp + MCP 三步实现智能体开发

Model Context Protocol（MCP）模型上下文协议是一种标准化协议，它让大模型能够更容易地和外部的数据、工具连接起来。你可以把MCP想象成一个通用的插头或者接口，就像USB-C一样，不管是什么设备，只要插上这个接口，就能和电脑、充电器等连接起来。

2025-05-23 11:02:26 787

原创全网最全！大模型零基础入门到精通，收藏这一篇就够！

大模型（Large Models）的训练是近年来人工智能领域的核心技术之一，尤其是在自然语言处理、计算机视觉等任务中，如 GPT、BERT 等模型的成功背后，离不开复杂的训练过程。本文将为你介绍大模型是如何训练的，包括数据准备、模型架构、训练方法和硬件支持等方面。

2025-05-22 11:38:35 841

原创 2025大模型面试全攻略：从基础到进阶，一文掌握

随着大模型应用场景的不断拓展，从智能聊天机器人到智能医疗诊断，从智能写作辅助到智能图像生成，其影响力无处不在，与之相应的，对大模型专业人才的需求也呈现出爆发式增长。如果你也渴望投身于这个充满机遇与挑战的领域，那么，一场精心准备的大模型面试便是你开启梦想之门的钥匙。

2025-05-22 11:27:04 681

原创【n8n系列】初学者必看：手把手教你配置节点与测试n8n工作流，还怕学不会？

本文面向n8n初学者，跟着我这篇教程，你能通过实现一个简单的工作流，掌握：

2025-05-22 11:16:26 1103

原创一文讲清楚市面上的开源大模型，小白都能看懂！

你是不是经常被大模型的型号搞的晕头转向，今天Qwen3发布，明天谷歌Gemma发布，后天LLaMa发布。作为一名刚接触AI的新手小白。看到这些新闻的时候根本搞不清楚他们都是啥？有什么区别？今天这篇文章把市面90%开源大模型汇总起来，一次性讲清楚，很适合想了解AI的新手小白。看完你就能懂哪些模型都是谁家的，以后最起码能看懂大模型更新的新闻讲的是啥。简单来说，大语言模型是一个用海量文本“喂大”的预测机器，它能像人一样理解和生成语言，但

2025-05-22 11:10:37 618

原创谷歌最新发布68页AI提示词工程，并做进了DeepSeek的知识库，附链接

这份目录清晰地展示了白皮书的结构：从基础概念（引言、基础知识）入手，深入探讨具体技术（从零样本到 ReAct），涵盖关键应用（代码），提及未来方向（多模态），并以实用建议（最佳实践）收尾。这种教学式的结构有助于读者理解信息的流向和内容的组织方式 1。从基础配置和零样本提示，到复杂的推理技术如 CoT、ToT 和 ReAct，这种递进关系表明，要实现

2025-05-21 11:19:29 572

原创一文讲清楚GPT系列模型的前世、今生：从GPT-1到GPT-4o

随着ChatGPT的发布，大语言模型的关注度和数量都在不断上升,它引领了人类进入了大模型时代，并且随着一轮一轮的迭代，最新模型已经进化到了GPT-4o。在众多大语言模型中，GPT系列因其代表性而备受关注，其发展历程和技术革新值得深入探讨。那么今天带大家回顾一下近年来GPT系列模型的发展。【参考中国人民大学《大语言模型》】GPT系列模型的基本原理是训练模型学习恢复预训练文本数据，通过只包含解码器的Transformer模型将广泛的世界知识进行压缩，使模型能够获得全面的能力。这一过程中，关键的两个要素是训练

2025-05-21 11:05:49 1292

空空如也

空空如也