AI大模型进阶教程-CSDN博客

原创 AI大模型RLHF 实践总结：从原理、代码以及踩坑与解决方案，这篇文章一次性说清楚！

如果你真的想学习大模型，请不要去网上找那些零零碎碎的教程，真的很难学懂！你可以根据我这个学习路线和系统资料，制定一套学习计划，只要你肯花时间沉下心去学习，它们一定能帮到你！

2025-06-04 19:28:51 962

原创大模型入门到精通之如何选择GraphRAG、LightRAG、AgenticRAG？

RAG是大模型定制化或者私有化部署时知识增强方法的最便捷、成本最低的方式，是一种新数据引入大模型的经济高效的方法，它大模型私有化部署必备的步骤。

2025-06-03 18:35:35 882

原创一文读懂医学基础模型，带你全面了解医学大模型到底是什么！

从ChatGPT到DeepSeek，大模型日渐受到越来越多的关注。在医学领域，大模型更多地被称作基础模型（Foundation Model），其通过大规模未标注数据集进行训练，能够有效应用于各种下游医学辅助诊断任务。本文综合考量临床需求与人工智能技术进展，旨在介绍基础模型的概念和术语，希望能够帮助各位读者了解大模型在医学领域产生的变革性影响。

2025-06-01 09:15:00 1446

原创初学者入门大模型：万字长文讲透 RAG 在实际落地场景中的优化

快速搭建一个RAG智能问答应用很简单，但是在实际业务场景落地还需要做大量的准备工作。

2025-05-29 19:42:25 721

原创大模型从理论到实践：RAG、Agent、微调等6种常见的大模型定制策略

大语言模型（LLM）是基于自监督学习预训练的深度学习模型，训练数据量庞大、训练时间长，并且包含大量的参数。LLM在过去两年中彻底改变了自然语言处理领域，展现了在理解和生成类人文本方面的卓越能力。

2025-05-29 19:15:29 990

原创 20 种典型的 AI 用例，看完这篇更好地理解AI 在不同领域的实际应用价值

在 AI 时代，了解 AI 的各种应用场景对职场人士的发展至关重要。今天，我将为大家详细介绍书中提到的 20 种典型的 AI 用例，帮助您更好地理解 AI 在不同领域的实际应用价值。

2025-05-28 19:54:23 785

原创一张图彻底搞懂AI智能体的底层框架逻辑

智能体能够通过接收文字、图片、语音、视频和各种外部传感器接收数据。无论是文字、图片、语音、视频或者温度、压力、角度等都是一种数据，这些数据最终转化为计算器所能够理解的信息。

2025-05-28 19:40:53 658

原创一文汇总11种新型检索增强生成（RAG）

随着人工智能的快速发展，检索增强生成（Retrieval-Augmented Generation，RAG）技术正在经历前所未有的演变。RAG技术通过将外部知识融入大型语言模型（LLM）的生成过程，极大地提高了AI系统的事实准确性和可靠性。如今，RAG正向更具智能性和自主性的方向发展，能够处理像超图这样的复杂结构，并适应各种专业领域的需求。

2025-05-27 18:03:42 833

原创大模型Dify搭建超实用工作流，职场人必备效率神器！

Dify 是一款开源的大语言模型（LLM）应用开发平台，融合了后端即服务（BaaS）与 LLMOps 理念，旨在助力开发者快速搭建生产级的生成式 AI 应用。其操作界面集成了 AI 工作流程、RAG 管道、代理、模型管理等功能，通过直观的可视化界面，用户可以轻松构建和测试功能增强的 AI 工作流程。

2025-05-27 17:40:11 1186

原创大语言模型引擎全解析：Transformers、vLLM、Llama.cpp、SGLang、MLX 和 Ollama，哪个才是最佳选择？

近年来，大语言模型（LLMs）如 GPT、LLaMA、BERT 等已经成为人工智能领域的核心驱动力。然而，如何高效地运行和优化这些模型，成为了开发者和研究者面临的重要挑战。为此，一系列专为大语言模型设计的引擎应运而生。本文将带你深入了解 Transformers、vLLM、Llama.cpp、SGLang、MLX 和 Ollama 这些引擎，帮助你找到最适合的工具，释放大语言模型的全部潜力！

2025-05-26 19:59:22 910

原创大模型微调实战：LORA轻量级微调DeepSeek

LORA（Low-Rank Adaptation）是一种高效的参数高效微调方法，其核心思想是通过在预训练模型的权重矩阵中引入低秩适配矩阵（低秩分解矩阵 A 和 B），仅对这部分新增参数进行训练，从而大幅减少计算和显存开销。与传统全参数微调相比，LORA 通过冻结原始模型参数，仅更新适配层参数，实现了轻量化训练。

2025-05-26 19:56:54 1403

原创大模型入门干货：算力与CPU、GPU、GPGPU、TPU、DPU，终于有人说清楚了！

“ 算力准备是大模型私有化部署的必要前提，那什么是算力？大模型算力芯片的种类有哪些？”无论是大模型训练阶段还是推理阶段都需要强大的算力支撑，什么是“算力”？大模型所需要的算力有何特点？

2025-05-24 18:58:40 1278

原创大模型Agent 在各个行业领域的 “花式玩法”，涉及电影、博客、医疗等多领域

今年大模型Agent的风口确实很强，那么今天作者就继续再给大家认真盘一盘大模型Agent在各个领域的“花式玩法”，涉及电影、博客、医疗、金融分析、软件、数据可视化、新闻审查、具身AI、web导航等，并且基本上都有源码的。如果你正在做这方面的工作，亦或者是正在寻求Agent应用灵感，这篇文章或许对你有帮助。

2025-05-23 21:39:21 1057

原创终于有人把 MCP 和 A2A 讲明白了！小白也能看懂的硬核科普！

听起来是不是有点“高大上”？别担心，今天我就用大白话，结合我自己的体验，跟大家聊聊这俩到底是啥，以及为啥我觉得它们可能预示着 **AI 智能体（Agent）真正“落地”的大时代，真的要来了！**

2025-05-23 21:36:44 1019

原创大模型实战指南：Dify+DeepSeek搭建本地知识库实现智能客服，只需几行代码！

这个问答机器人内置你本地行业知识库，DeepSeek+垂直领域专业知识库，让AI真正在企业中落地应用起来。

2025-05-22 14:08:43 890

原创一文帮你看懂大模型行业黑话：AI、机器学习、大模型、LLM、Agent 都是啥关系？

如果你真的想学习大模型，请不要去网上找那些零零碎碎的教程，真的很难学懂！你可以根据我这个学习路线和系统资料，制定一套学习计划，只要你肯花时间沉下心去学习，它们一定能帮到你！

2025-05-22 12:03:06 1030

原创初学者入门大模型：一文彻底搞懂大模型RAG（检索、增强、生成）

**RAG（Retrieval-Augmented Generation，检索增强生成）是一种结合了信息检索技术与语言生成模型的人工智能技术。****该技术通过从外部知识库中检索相关信息，并将其作为提示（Prompt）输入给大型语言模型（LLMs）****，以增强模型处理知识密集型任务的能力，如问答、文本摘要、内容生成等。RAG模型由Facebook AI Research（FAIR）团队于2020年首次提出，并迅速成为大模型应用中的热门方案。**

2025-05-21 14:59:35 1080

原创与其死磕大模型，不如学会专业模型+Agent这才是大模型的未来之路！

大语言模型（LLMs）的规模越来越大，但这并不意味着它们就更加出色。由确定性编排和基于代理的架构支持的专业模型，正为我们开辟一条更智能、更精准、更可靠的发展道路。

2025-05-21 14:17:36 976

原创人工智能技术的发展为什么远超普通人的想象？我们又该做什么？

一项新技术的出现往往伴随着很多的争议，两千年左右的互联网，前几年的元宇宙，到现在的人工智能；但技术的发展并不会因为争议而停止，虽然有些技术目前来看确实只是一个噱头，但原因可能并不在技术本身，而在于当前的技术水平无法支撑如此庞大的体系。而以人工智能技术来说，其发展速度已经远超普通人的想象，虽然很多人在说人工智能的应用还存在各种各样的问题，但这是技术发展过程中所面临的必然过程。

2025-05-21 14:03:49 823

原创 2025大模型落地技术路线图，想把大模型应用到自己的业务里，看完这篇就够了！

如果你真的想学习大模型，请不要去网上找那些零零碎碎的教程，真的很难学懂！你可以根据我这个学习路线和系统资料，制定一套学习计划，只要你肯花时间沉下心去学习，它们一定能帮到你！

2025-05-20 11:42:36 1067

原创企业级大模型AI应用市场正在高速爆发！

模型AI应用在消费级市场的爆发，已引发各界广泛关注。不论是ChatGPT带动的第一波浪潮，还是DeepSeek之后更多中国大模型AI应用的涌现，从AI智能助手到AI陪伴应用，再到AI在各个领域的产品，应用层在全面爆发。但实际上，还有另一个易于忽略却刚需明确、广受看好的赛道，爆发得更迅猛——**企业级大模型AI应用市场**。

2025-05-20 11:38:42 1088

原创从零开始学习这9种AI技巧，打工人必备神器赶紧学起来！

为什么下一波人工智能浪潮并非只属于技术人员？想象一下，一年之后，从人工智能中赚取最多收入的人不再只是那些常见的程序员、营销人员或销售专家。不，真正的赢家是那些决定掌握一些关键人工智能技能的普通人。你猜怎么着？你无需成为技术专家也能加入他们。

2025-05-19 21:55:27 1298

原创 AI会怎么发展？对产品经理与工程师又有什么影响？

从2023年以来的2年多发展，这一波AI浪潮一直在继续，未来，AI会走向哪里呢？作者认为有两个思路：一个是认识世界，一个是改造世界。

2025-05-18 10:00:00 592

原创新手必读！从零开始预训练大语言基础模型，创建属于你自己的大语言神器

在当今的技术领域，大语言基础模型正发挥着越来越重要的作用。然而，从零开始预训练这样一个模型是一项复杂且充满挑战的任务。本文将为初学者详细介绍如何完成这一过程，包括原理讲解、训练数据来源、训练方法、评估方法、优化方法以及可选的训练框架，并附上相关代码和操作流程。

2025-05-18 08:45:00 891

原创万字长文详解：企业AI落地十大黄金场景（附学习资源））

本文将从智能客服、预测性维护、金融风控、个性化推荐、供应链优化、文档自动化、营销创作、质量检测、医疗辅助到企业知识管理这十大落地场景，层层剖析每个场景中的实际应用、面临的挑战以及大模型的技术要求，并辅以真实案例，为您展现一幅企业AI落地的全景图。‍‍

2025-05-17 09:45:00 768

原创 2025想系统学习AI大模型，一定要先看这篇文章！

自ChatGPT发布以来，大模型的概念逐渐被大众所熟知，从大语言模型到端到端模型再到如今的多模态模型。不同模型之间的概念和区别，很多刚入门AI的小白可能很容易混淆。我之前在文章中、视频中其实都有陆续普及过，但都是单篇论述单个模型，内容和形式上都过于分散，包括市面上的文章，也都存在这种问题，所以在学习的过程中需要分别去查找，给大家的学习造成了一定的阻碍。

2025-05-17 09:15:00 745

原创三分钟了解通用\行业\场景大模型的区别和联系

前言，智算中心核心任务是承载AI大模型的训练及推理等，进而为各行各业提供便捷、高效、领先和普惠的多元化“算力服务”，大模型作为智算时代的核心“产物”被大家广泛关注，从技术迭代和应用角度可细分为三个类型分别为基础大模型、行业大模型以及场景大模型（垂类大模型）。三者之间的区别和联系是什么？非专业领域朋友如何快速记住它们特点呢？今天我们简单聊聊！

2025-05-16 09:30:00 626

原创 AI大模型技术详解：提示工程、RAG、AI Agent、 Fine-tuning、Function calling、知识库、知识图谱等应用

大模型在人工智能领域的应用正迅速扩展，从最初的提示词（Prompt）工程到追求通用人工智能（AGI）的宏伟目标，这一旅程充满了挑战与创新。本文将探索大模型在实际应用中的进展，以及它们如何为实现AGI铺平道路。

2025-05-16 09:30:00 1796

原创初学者入门AI大模型：一文掌握7种大模型微调的方法

本篇文章深入分析了大型模型微调的基本理念和多样化技术，细致介绍了LoRA、适配器调整(Adapter Tuning)、前缀调整(Prefix Tuning)等多个微调方法。详细讨论了每一种策略的基本原则、主要优点以及适宜应用场景，使得读者可以依据特定的应用要求和计算资源限制，挑选最适合的微调方案。

2025-05-15 10:15:00 935

原创大模型AI Agent开发实战：如何打造一个高效的智能问答系统

智能问答系统作为人工智能技术体系中的核心分支，凭借其在响应效率与服务便捷性方面的突出优势，正在深刻变革人类社会的传统信息交互模式。本文将系统阐述智能问答系统的整体架构设计原理与技术实现路径，旨在为相关从业者提供系统性认知框架，助力该技术在实际业务场景中的有效落地。

2025-05-15 09:15:00 964

原创小白入门大模型：一步步教你梳理大模型技术学习过程，收藏这一篇就够了！

人工智能技术是一个通过某种技术手段人为的创建一个具有类人智能的系统(软件或硬件)，而大模型技术是一种仿造人类学习进化的一种方式，使用深度学习(机器学习)算法模仿人类大脑神经元，来实现智能的一种方式，其主要载体是神经网络。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

2025-05-14 09:45:00 685

原创大模型微调与RAG检索增强有何区别？从基础原理到案例分析全面详解

如果你一直在跟着Fanstuck博主的脚步探索AI大模型的相关内容，从最初的大模型Prompt工程解析，DeepSeek全面解析，到实际的私有化大模型开发部署，再到深入NL2SQL、知识图谱大模型和ChatBI等更高阶应用.我是Fanstuck，致力于将复杂的技术知识以易懂的方式传递给读者，热衷于分享最新的行业动向和技术趋势。如果你对大模型的创新应用、AI技术发展以及实际落地实践感兴趣，那么请关注Fanstuck。

2025-05-14 08:45:00 644

原创 AI大模型为什么这么火？大模型到底是什么？写给小白的科普贴！

从去年到今年，大模型、chatGPT等概念和技术越来越火，但是像笔者一样的技术小白一直对大模型是一种似懂非懂的状态。鉴于最近在做基于大模型和Agent的上层AI应用，如若不了解底层概念，始终还是会限制产品层的能力，因此，最近2周零散时间读完了这本由复旦团队出版的《大规模语言模型：从理论到实践》，基本涉及到了大模型入门所需的核心框架内容，适合扫盲看。

2025-05-13 08:45:00 1142

原创初学者入门大模型之prompt工程：什么是prompt？什么是prompt工程？

Prompt是一种基于人工智能（AI）指令的技术，通过明确而具体的指导语言模型的输出。在提示词工程中，Prompt的定义涵盖了任务、指令和角色三个主要元素，以确保模型生成符合用户需求的文本。

2025-05-13 08:00:00 707

原创 90%的从业者都误解了：大模型核心原理其实很简单

在对大模型的了解和应用过程中发现一个问题，就是很多人对大模型抱着神秘和高大上的想法；认为搞大模型的都是技术大拿或者高学历的精英人才，甚至有些人会认为大模型无所不能。但事实上，大模型没有大家想象中的那么神秘和复杂；大模型也有自己的能力边界，它也无法做到超出它能力范围的事；而且现在大模型也存在各种各样的问题，否则大模型技术就不再需要发展了。

2025-05-12 13:41:46 1074

原创初学者入门大模型：一文讲透大模型里的 RAG、Agent、微调和提示词工程

最近，人工智能大模型火得一塌糊涂，各种新名词也层出不穷：RAG、Agent、微调、提示词工程……是不是听着就头大？别担心，今天咱们就用大白话，把这些概念一次性讲清楚，让你彻底搞懂它们是什么、有什么用，以及它们之间的区别和联系。

2025-05-12 11:58:23 1137

原创一文梳理大模型简史，从Transformer（2017）到DeepSeek-R1（2025）

如果你真的想学习大模型，请不要去网上找那些零零碎碎的教程，真的很难学懂！你可以根据我这个学习路线和系统资料，制定一套学习计划，只要你肯花时间沉下心去学习，它们一定能帮到你！点击领取：2025最新最全AI大模型资料包：学习路线+书籍+视频+实战+案例…

2025-05-10 14:04:57 881

原创一文剖析大模型、RAG、Agent、MCP、Function Calling、知识库、向量数据库、知识图谱、AGI 的区别和联系

如果你真的想学习大模型，请不要去网上找那些零零碎碎的教程，真的很难学懂！你可以根据我这个学习路线和系统资料，制定一套学习计划，只要你肯花时间沉下心去学习，它们一定能帮到你！如果你真的想学习大模型，请不要去网上找那些零零碎碎的教程，真的很难学懂！你可以根据我这个学习路线和系统资料，制定一套学习计划，只要你肯花时间沉下心去学习，它们一定能帮到你！点击领取：2025最新最全AI大模型资料包：学习路线+书籍+视频+实战+案例…

2025-05-10 13:56:47 1002

原创大模型面经：美团大模型算法二面：Function Call三连炮！差点被问懵了！

随着DeepSeek爆火，面试中也越来越高频出现，因此训练营也更新了DeepSeek系列技术的深入拆解。包括MLA、MTP、专家负载均衡、FP8混合精度训练，Dual-Pipe等关键技术，力求做到全网最硬核的解析~这是美团某个部门大模型算法的二面题目，我们来看其中的 10、11、12 题，是一个关于大模型中 Function call 的连环炮拷问。

2025-05-10 13:42:34 579

原创 LLM 算法工程师的速成指南：微调、强化学习微调与偏好微调

**①强化学习微调（Reinforcement Fine-Tuning）：** 仅需少量高质量数据（数十到数千个），模型即可通过强化学习处理复杂任务。**②偏好微调 (Preference Fine-Tuning, PFT) ：** 采用直接偏好优化 (例如Direct Preference Optimization, DPO) 算法，通过比较不同的模型输出，让 AI 能够学习并区分 “更好” 的回复，从而在语气、风格、创造性等主观性任务上表现更出色。

2025-05-09 15:01:58 978

空空如也

空空如也