AI大模型学习不迷路-CSDN博客

原创全网爆火神书《从零构建大模型》终于有中文版的啦！LLM大模型神仙入门书籍教程分享！

《从零构建大模型》这本书主要使用的是 pytorch 框架，而不是依靠各种库。通过它，不仅可以掌握 LLM 的理论知识，还能通过动手实践，学习如何从头构建一个功能强大的语言模型。这本书从大模型的基础知识讲起，从内到外地分析大模型的工作原理，并用清晰的文本、图表和示例解释，引导读者逐步创建属于自己的大模型。

2025-05-08 10:59:47 247

原创两大智能体框架 Dify vs Langchain 怎么选？来一个彻底、全面、深入的分析

在 AI 智能体应用开发的世界里，选择一个合适的框架是至关重要的。选对智能体平台非常关键，它直接影响你的AI应用的效率、可扩展性和整体表现。一个合适的平台能简化开发过程，增强模型集成，并优化用户体验。近年来，AI 智能体应用开发工具经历了显著的演变。框架类型核心功能许可证主要语言LangChain开发者工具包模块化LLM编排、RAG、代理MITDify低代码平台快速应用开发、RAG、代理Apache 2.0Python, JSLlamaIndex数据框架。

2025-05-08 10:53:36 652

原创如何快速入门大模型？写给小白的大模型技术学习路线！

经验总结：定期回顾学习过程，总结技术要点和实战经验跨学科融合：探索大模型在其它领域(如金融，法律，医疗等)等应用，扩展知识广度‍如果用一句话总结就是，学习——实践——再学习——再实践。在大模型时代，我们如何有效的去学习大模型？现如今大模型岗位需求越来越大，但是相关岗位人才难求，薪资持续走高，AI运营薪资平均值约18457元，AI工程师薪资平均值约37336元，大模型算法薪资平均值约39607元。掌握大模型技术你还能拥有更多可能性。

2025-05-08 10:51:28 1104

原创大厂大模型必知的5种agent模式

大模型应用开发需要掌握机器学习算法、深度学习框架等技术，这些技术的掌握可以提高程序员的编码能力和分析能力，让程序员更加熟练地编写高质量的代码。包括：大模型学习线路汇总、学习阶段，大模型实战案例，大模型学习视频，人工智能、机器学习、大模型书籍PDF。观看零基础学习书籍和视频，看书籍和视频学习是最快捷也是最有效果的方式，跟着视频中老师的思路，从基础到深入，还是很容易入门的。以大模型平台应用与开发为主，通过星火大模型，文心大模型等成熟大模型构建大模型行业应用。如果你是零基础小白，想快速入门大模型是可以考虑的。

2025-05-07 20:45:29 403

原创 AI大模型学习总结

先说结论：我认为每天学4小时，两个月的时间可以对AI大模型有一个系统的入门。接下来我想说说这60天的学习心得，分享给那些想入行AI大模型，或者刚刚起步的同学。

2025-05-07 20:43:47 778

原创 RAG最佳实践：一篇让你不再迷茫的指南

重排序：monoT5综合表现最佳，TILDEv2适合快速实验摘要：Recomp碾压其他方案，但会牺牲些许延迟📌 我的私藏技巧：尝试“逆向重组”（Reverse Packing），把关键信息放在输入的开头或结尾——LLM更容易捕捉重点！

2025-05-06 10:54:50 932

原创一下午面了三个大模型岗，全是一言难尽...

真服了，我不信有这个题，还不会常见的业务题。

2025-05-06 10:51:40 1073

原创一文详谈RAG优化方案与实践

阿里妹导读RAG通过检索现有的大量知识，结合强大的生成模型，为复杂的问答、文本摘要和生成任务带来了全新的解决方案。本文详细的介绍了RAG遇到的挑战、通用范式、工程实践、优化实现策略等。一、RAG的背景介绍随着ChatGPT的兴起，大语言模型再次走进人们的视野，其在NLP领域表现出的语言识别、理解以及推理能力令人惊叹。越来越多的行业开始探索大语言模型的应用，比如政务、医疗、交通、导购等行业。通义系列、GPT系列、LLama系列等模型，在语言交互场景下表现十分抢眼。

2025-05-05 13:00:00 732

原创复旦大学《大规模语言模型：从理论到实践》完整PDF和PPT课件下载

大语言模型（Large Language Models，LLM）是一种由包含数百亿以上权重的深度神经网络构建的语言模型，使用自监督学习方法通过大量无标记文本进行训练。自2018年以来，包含Google、OpenAI、Meta、百度、华为等公司和研究机构都纷纷发布了包括BERT， GPT等在内多种模型，并在几乎所有自然语言处理任务中都表现出色。2021年开始大模型呈现爆发式的增长，特别是2022年11月ChatGPT发布后，更是引起了全世界的广泛关注。

2025-05-04 05:30:00 1001

原创大模型年度书籍推荐！《AI大语言模型的基础与前沿》，优质书籍程序员必看！

全球首个完全自主的 AI 软件工程师上线，它是来自 Cognition 这家初创公司的产品——Devin，这个名字也随即引爆了科技圈。话说 Devin 有多能干？它能实现端到端的完整项目开发。也就是说，只需一句指令，Devin 就可以从零构建出一个完整互联网应用，其他工作还可以自主查找并修复代码中的 bug，甚至是训练和微调自己的 AI 模型。更厉害的是，Devin 还通过了一家 AI 公司的技术面试，并且在 Upwork 上完成了实际工作。

2025-05-02 12:30:00 679

原创 RAG破局之战:详解靠谱答案的底层逻辑，告别大模型幻觉

什么是RAG？RAG（Retrieval-Augmented Generation，检索增强生成）是一种结合了**信息检索（Retrieval）和文本生成（Generation）**的技术。RAG技术通过实时动态地从外部知识库中检索相关信息，并将其作为上下文输入生成模型中，从而减少模型因“知识盲区”或训练数据过时而产生的错误（幻觉问题），提高生成结果的时效性和准确性。总结一句话：RAG就是给AI装上"知识导航"，通过检索外部数据，增强大模型的生成效果****重要性：RAG是当前大模型落地的重要技术之一，尤

2025-05-01 13:45:00 663

原创 AI大模型优化指南：RAG、提示工程与微调的应用场景解析

随着技术的不断进步，大模型的优化方式也在不断演化。从传统的提示调整到更智能的检索生成，AI模型正在向着更高效、更智能的方向发展。未来，我们可能会看到更多智能化的优化工具和方法，例如自动微调、实时上下文检索等，将进一步提升模型的智能化水平和应用效果。对于AI从业者和开发者来说，掌握这些优化手段不仅可以提升自身项目的成功率，还能在竞争激烈的AI时代中占据有利位置。

2025-04-30 16:44:26 808

原创 AI大模型·白皮书 | 清华大学-关于人工智能大模型的几点思考2025

人工智能进入大模型时代，大模型从单模态向多模态发展，在文本交互、图像创作、视频生成等方面成果显著，并加速行业智能化升级。但大模型发展面临数据存储、算力、数据预处理等挑战，如海量小文件存储的元数据管理难、训练需海量算力、数据预处理开销大等。为此提出多种解决方案，包括设计新的文件系统、以数据为中心的计算模式、分布式检查点策略等。同时，中国 AI 内循环加速，国产算力快速发展，相关基础软件层不断完善，在大模型训练和推理方面取得性能提升。技术报告的思维导图如下：这篇由。

2025-04-23 21:30:03 884

原创一文搞懂RAG构建知识库和知识图谱

RAG（Retrieval-Augmented Generation，检索增强生成）****技术通过检索增强生成，显著提升了知识问答的准确性和时效性。在构建知识库时，RAG通过****向量数据库和动态更新机制，实现了高效的知识检索与生成****；在构建知识图谱时，RAG通过G****raphRAG和Graphusion****等框架，实现了实体关系的****精准抽取与图谱融合****。***一、RAG***

2025-04-23 21:24:05 763

原创上交2025最新-《动手学大模型》实战教程及ppt分享！

今天分享一个上海交大的免费的大模型课程，有相关教程文档和Slides，目前是2.2K星标，还是挺火的！

2025-04-22 22:51:00 239

原创大模型Prompt技巧全解析

在数字化浪潮的推动下，AI大模型以其卓越的自然语言处理能力和智能交互特性，迅速在很多领域中占据了重要地位。比如：与传统客服相比，AI大模型展现出了无可比拟的优势，通过精心设计的 prompt，能使我们在客服托管、智能客服等多个项目和业务场景中发挥显著作用，大幅提高工作效率，优化成果质量。为了精进个人能力以及助力产研学习氛围的提升，本人在学习完吴恩达教授以及其他前辈们有关 prompt 的课程之后，整理了这份学习资料，以供大家学习交流。该笔记将深入探讨 prompt 的定义和撰写框架，详细阐述打造高效 pro

2025-04-22 22:47:39 992

原创给大家揭秘大模型60天速成攻略（乞丐版）[特殊字符]⚡

无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。现如今大模型岗位需求越来越大，但是相关岗位人才难求，薪资持续走高，AI运营薪资平均值约18457元，AI工程师薪资平均值约37336元，大模型算法薪资平均值约39607元。很多人学习大模型的时候没有方向，东学一点西学一点，像只无头苍蝇乱撞，下面是我整理好的一套完整的学习路线，希望能够帮助到你们学习AI大模型。第七阶段：以大模型平台应用与开发为主，通过星火大模型，文心大模型等成熟大模型构建大模型行业应用。

2025-04-17 13:41:17 1025

原创 MCP、RAG、Agent之间的概念和关系，被我和AI协作的12张图总结了

MCP、RAG、Agent 最近太火了，搞 AI 的都在聊，但发现身边很多朋友其实并不太懂这些概念花了一整天和 AI 协作，终于把这些复杂概念画成了 10 张易懂的图解从 MCP 的提示混合机制，到 RAG 的知识检索增强，再到 Agent 的自主决策框架，每张图都尽量简化到小白也能看懂的程度。其实技术没那么难懂，只是需要有人用简单方式解释而已。

2025-04-17 11:58:13 869

原创从入门到精通Transformer，掌握NLP技术这本书必看《从零开始构建最先进的NLP模型》

国内第1本Transformer——变形金刚红书《从零开始构建最先进的NLP模型》如果一定要说未来谁能引领人工智能世界，是Transformer而非chatGPT！编辑推荐★★★★★ChatGPT红得发紫，强得让人类心悸。但在它的背后，还隐藏着一位真正的大佬。它的名字叫做——Transformer！

2025-04-16 18:23:17 758

原创一文掌握Prompt：万能框架+优化技巧+常用指标

随着大模型在2023年横空出世，“Prompt 工程” 应运而生，作为用好大模型最重要的武器，Prompt 的好坏对模型效果有着决定性的影响。然而，网络上大量相关文章多是罗列“Prompt 工程” 中的若干技巧，少有体系化的总结，让人看完依然不知道该如何入手。本文希望结合我们在 “Prompt 工程” 中的实践经验，更加体系化地对 “Prompt 工程” 进行梳理，希望可以一步步地帮助大家用好大模型，人人都是 Prompt 工程师。

2025-04-16 18:20:03 959

原创斯坦福2025 AI指数出炉！中美AI终极对决差距仅剩0.3%，DeepSeek领衔

2025年斯坦福HAI报告重磅发布，456页深度剖析全球AI领域的最新趋势：中美顶级模型性能差距缩至0.3%，以DeepSeek为代表的模型强势崛起，逼近闭源巨头；推理成本暴降，小模型性能飙升，AI正变得更高效、更普惠。就在刚刚，每年都备受瞩目的斯坦福AI指数报告，重磅发布了！这份报告由斯坦福大学以人为本AI研究员发布，代表着每年AI领域最核心和前沿的动向总结。今年，这份报告长达456页，抛出不少惊人观点。

2025-04-14 10:39:35 1045

原创关于打造高质量RAG系统的问题记录

RAG的核心是怎么快速准确地召回数据，但RAG的难点还有文档处理等问题。RAG技术是目前大模型应用的主要技术方向之一，常被应用于数据检索，智能客服等应用场景；而最近在做一个问答系统的场景，使用到了RAG技术，因此今天再来记录一下关于RAG在实际场景中所遇到的问题。关于RAG的问题关于RAG的整体流程这里就不多做介绍了，总而言之RAG的核心点有两个，其一是检索，其二是生成；生成这里就不多说了，生成的质量一靠大模型的能力，二靠提示词的质量，三靠检索回来的语料质量。

2025-04-14 10:36:36 801

原创说实话，算法岗transformer面试确实有难度.

Transfomer是一种基于注意力机制的神经网络模型。Transformer模型由编码器和解码器两部分组成，其中编码器用于将输入序列编码成一个高维向量表示，解码器用于将这个向量表示解码成目标序列。Transformer模型最核心的部分是自注意力机制，它能够让模型在不同位置之间进行信息传递和交互，从而更好地学习输入序列中的信息。

2025-04-12 11:23:41 626

原创【大模型微调】一文掌握7种大模型微调的方法

本篇文章深入分析了大型模型微调的基本理念和多样化技术，细致介绍了LoRA、适配器调整(Adapter Tuning)、前缀调整(Prefix Tuning)等多个微调方法。详细讨论了每一种策略的基本原则、主要优点以及适宜应用场景，使得读者可以依据特定的应用要求和计算资源限制，挑选最适合的微调方案。大型语言模型(LLM)的训练过程通常分为两大阶段：阶段一：预训练阶段在这个阶段，大型模型会在大规模的无标签数据集上接受训练，目标是使模型掌握语言的统计特征和基础知识。

2025-04-11 21:47:16 648

原创 35岁程序员抓住风口，转行AI大模型，实现收入暴涨10倍，彻底挽救职业生涯？_35岁java程序员能转ai大模型吗

恕我直言，就这几天，各大厂都在裁员，什么开发测试运维都裁，只有大模型是急招人。你说你不知道大模型是什么？那可太对了，你不知道说明别人也不知道，就是要趁只有业内部分人知道的时候入局！尤其是干程序员的，绝对要抓住这个机会，我不是危言耸听，经历过Java、Python、大数据的，都应该知道，每个新技术，风口就那么多年，技术迭代的很快。

2025-04-11 17:00:59 1102

原创【大模型科普】5分钟带你了解大模型中的“token“！

1.1 token的本质定义在大语言模型的世界里，token是文本处理的基本单位，可以看作是文本的"原子"。简单来说，token是将原始文本分解后得到的最小有意义单元，类似于人类语言中的"词"或"字"，但又不完全相同。当大模型接收到一段医疗文本（如病历、护理记录），会让分词器将其切成很多个小块，这些小块就是token。token可以是单个汉字、词语、短语、标点符号，甚至是单词的一部分。当大模型输出时，也是一个token，一个token生成的，因此在回答界面看起来好像大模型在打字回答你一样。

2025-04-07 23:15:11 1150

原创学大模型必看这个gitHub项目！！汇集了所有开源中文大模型资源，含各领域微调大模型、数据集及教程_llm-action github

Awesome-Chinese-LLM 整理了开源的中文大模型相关资源，包括开源底座模型、垂直领域微调模型应用、数据集及教程等。目前，收录的资源已超过100个，涵盖了从小型到大型的多种模型，如ChatGLM、LLaMA、Baichuan、Qwen等。以规模较小、可私有化部署、训练成本较低的模型为主。

2025-04-07 23:10:16 1084

原创万字详解｜基于RAGFlow框架搭建企业知识库指南

在生成式人工智能（Generative AI）快速发展的当下，大语言模型（LLMs）的幻觉问题始终是制约其落地应用的关键瓶颈。检索增强生成（RAG）技术通过引入外部知识库，将动态检索与生成能力结合，为解决这一难题提供了重要思路。

2025-03-31 22:10:15 1816

原创大模型入门超全指南来了！人大团队力作，内附一线开发经验

1.全面解读大语言模型本书内容基本全覆盖大语言模型训练与使用的全流程，从预训练到微调与对齐，从使用技术到评测应用，帮助读者全面掌握大语言模型的核心技术。2.丰富的配套代码与工具本书以核心算法技术为基础，并配有大量的代码实战与讲解，同时搭配相关的开发工具包LLMBox与YuLan大模型，供读者深入阅读理解相关技术。3.通俗易懂，专业权威本书兼顾理论深度与阅读体验，以清晰的语言与丰富的图解，降低技术门槛，让初学者和专业人士都能轻松上手。

2025-03-28 23:13:16 834

原创关于智能体Agent的实现技术之思维链和函数调用(function call)的思考

智能体是未来人工智能的一个重要应用技术，而其难点就在于怎么让大模型具备更好的独立思考和任务拆解与规划的能力。Agent技术也被业界称为智能体技术，本质上是使得大模型具备独立思考和解决问题的能力；被广泛应用于各种应用场景，而且也被称为是实现通用人工智能的一种技术手段。但在此之前对于智能体的理解比较肤浅，而今天突然发现原来智能体没我们想象中的那么简单，也没想象中的那么复杂。今天我们就从Agent的两个实现技术之思维链和函数调用来重新理解智能体。智能体和思维链以及函数调用。

2025-03-28 23:04:21 895

原创想要转行大模型，程序员该如何学习？（学习路线、知识体系）巨详细！！！

想转型AI大模型应用工程师的码住了❗没规划的真先别动，这个AI大模型学习路线详细的介绍了每个阶段需要掌握的内容，自己也是跟着这个路径掌握的大模型技术。想学AI大模型技术但还不知道学那些？

2025-03-24 22:48:25 865

原创 2025大模型学习入门必看(万字详解问答助手、RAG框架、本地部署千问模型)

设计提示词或问题的方式将直接影响模型预测下一个词的概率，使用少量样本（few-shot）的方法，将想要的问答例子加入提示词中，指导LLM如何利用检索到的知识，也是提升LLM生成内容质量的有效方法。在 RAG 系统中，通过嵌入模型生成的所有向量都会被存储在这样的数据库中。包括：大模型学习线路汇总、学习阶段，大模型实战案例，大模型学习视频，人工智能、机器学习、大模型书籍PDF。观看零基础学习书籍和视频，看书籍和视频学习是最快捷也是最有效果的方式，跟着视频中老师的思路，从基础到深入，还是很容易入门的。

2025-03-24 22:24:02 835

原创好书推荐-为什么我学大模型的时候没有刷到这本书《大型语言模型实战指南》

在角色扮演应用中，大型语言模型通过模拟不同角色的性格、故事背景、情感状态和行为模式，为用户提供了高度沉浸式的交互体验。《大型语言模型实战指南》主要介绍了大型语言模型的基础理论、实战案例、优化与部署方法，以及未来趋势与挑战，为读者提供了从入门到精通的全面指导。RAG技术通过结合检索和生成的方法，有效解决了大型语言模型在生成答案时可能出现的幻觉问题，提高了答案的可靠性和准确性。AI Agent作为能够感知环境、自我决策并采取行动的人工智能实体，具有广泛的应用范围和多样化的功能。大型语言模型实战指南。

2025-03-22 23:33:59 960

原创 LLM 提示工程：直接提问 (Zero-Shot Prompting) 技巧与优化

大模型应用开发需要掌握机器学习算法、深度学习框架等技术，这些技术的掌握可以提高程序员的编码能力和分析能力，让程序员更加熟练地编写高质量的代码。包括：大模型学习线路汇总、学习阶段，大模型实战案例，大模型学习视频，人工智能、机器学习、大模型书籍PDF。观看零基础学习书籍和视频，看书籍和视频学习是最快捷也是最有效果的方式，跟着视频中老师的思路，从基础到深入，还是很容易入门的。以大模型平台应用与开发为主，通过星火大模型，文心大模型等成熟大模型构建大模型行业应用。如果你是零基础小白，想快速入门大模型是可以考虑的。

2025-03-21 15:14:01 707

原创我愿称它为Transformer最全面的入门指南

我愿称它为Transformer最全面入门指南！里面包含自然语言处理、Transformer模型、注意力机制、微调预训练模型、Transformer实战训练、大模型等内容！Transformers 库的基本结构和功能学会使用 Transformers 库加载和调整预训练模型；掌握自定义模型和数据处理方法；4⃣常见的 NLP 任务，如文本分类、命名实体识别、机器翻译等；5⃣Transformers 库在工业界的应用案例和最佳实践。刚接触 NLP 领域的学生和研究人员；

2025-03-21 15:06:53 1059

原创一篇85页的面向推理型大模型的Long-CoT技术最新综述

推理型大模型（Reasoning Large Language Models）例如等在数学和编程等复杂领域展现了令人印象深刻的能力。它们成功的关键因素之一在于它们应用了（Long Chain-of-Thought, Long CoT）的特性，这种特性增强了模型的推理能力，使其能够解决复杂的问题。。包括其格式和学习方法。关注反思过程中的反馈和优化策略中的细化技术。涉及长链推理的关键改进，包括规模扩展、内部探索和外部探索。

2025-03-17 23:14:58 923

原创【报告】AI时代来袭：中小企业如何抓住千载难逢的发展机遇？AI时代中小企业智能化发展报告（附PDF下载）

💰 预计至2027年，中国AI市场规模将达到15372亿人民币，渗透率将达到39.5%！💡 AI在各行各业的应用逐渐深入，助力企业降本增效、创新商业模式。🚀 中小企业需积极应对挑战，提升智能化水平，抓住AI时代的红利！🌟 政策、资本、技术三重驱动，助推中小企业融入AI浪潮！📈 AI技术发展迅猛，为中小企业带来巨大机遇！

2025-03-17 23:00:24 275

原创基于LangChain-Chatchat实现的RAG-本地知识库的问答应用[1]-最新版快速实践并部署（检索增强生成RAG大模型）_rag知识库

一种利用langchain思想实现的基于本地知识库的问答应用，目标期望建立一套对中文场景与开源模型支持友好、可离线运行的知识库问答解决方案。建立了全流程可使用开源模型实现的本地知识库问答应用。本项目的最新版本中通过使用FastChat接入 Vicuna, Alpaca, LLaMA, Koala, RWKV 等模型，依托于langchain框架支持通过基于FastAPI提供的 API用服务，或使用基于Streamlit的 WebUI 进行操作。

2025-03-15 13:44:19 910

原创 AI大模型时代，2025大龄程序员如何轻松转型赢未来？

在科技行业的高速发展中，大龄程序员这一群体正面临着前所未有的挑战。随着新兴技术的不断涌现，如云计算、大数据、人工智能等，传统的编程技能逐渐显得“过时”。同时，年轻一代的程序员以更加低廉的薪酬和旺盛的精力涌入市场，加剧了职场的竞争。对于大龄程序员而言，他们不仅需要应对技能更新的压力，还常常受到年龄歧视的影响，尤其是在追求创新和速度的科技公司中。许多大龄程序员发现自己处于尴尬境地，一方面拥有丰富的项目经验和深厚的技术底蕴，另一方面却面临晋升空间狭窄和职业发展的瓶颈。

2025-03-15 13:41:04 1317

原创 OpenAI新Agent套件全解析，以及发布会没说的30+要点

凌晨 1 点的时候，OpenAI 发布了全套 Agent 开发套件，让手搓 Manus 触手可及。套件包含 4 个主要内容Responses API：本次发布会的核心，可视作 Chat API 的上位升级内置工具（Built-in Tools），有三个：网页搜索、文件搜索和 Computer Using Agent（CUA）Agents SDK：这是个开源 Agent 框架（你没看错，OpenAI Open 了），让开发者能够更轻松地构建和管理复杂的单 Agent 和多 Agent 系统。监控工具：在

2025-03-14 16:46:05 1125

空空如也

空空如也