大模型学习-CSDN博客

原创新手必看！我如何6步用（Coze）轻松搭建了一个AI智能体

AI智能体就像是一个虚拟的"小助手"。它能听懂你的话，理解你的需求，并帮你完成任务。想象一下，你有了一个24小时待命的私人助理，随时随地为你服务。这就是AI智能体的魅力所在。

2025-01-04 17:19:05 7190

原创一图了解大模型是什么？附国内外知名大模型及240余家大模型清单！

引申到模型层面，涌现能力指的是当模型的训练数据突破一定规模，模型突然涌现出之前小模型所没有的、意料之外的、能够综合分析和解决更深层次问题的复杂能力和特性，展现出类似人类的思维和智能。简而言之，大模型是指利用海量数据，通过先进的算法和技术，训练得到的具有强大预测和决策能力的模型。它们利用大算力、使用海量的开放数据与具有巨量参数的深度学习算法，在大规模无标注数据上进行训练，以寻找特征并发现规律，进而形成可“举一反三”的强大泛化能力，可在不进行微调或少量微调的情况下完成多场景任务，相当于AI完成了“通识教育”。

2024-12-09 16:00:36 3208

原创太强了！10大开源大模型！

近期，Meta 隆重推出了两款开源模型：Llama 3 8B与Llama 3 70B，这两款模型可供外部开发者免费使用。Meta 表示，Llama 3 8B和Llama 3 70B在目前同体量模型中，展现出卓越的性能，堪称业界的佼佼者。从Meta 分享的基准测试结果来看，Llama 3 400B+ 的实力不容小觑，其性能已逼近Claude超大杯以及新版GPT-4 Turbo，虽然还存在一定的差距，但足以证明它在顶尖大模型领域已占有一席之地。

2024-11-23 11:20:38 4513

原创 “农业+大模型”的八大应用场景及成功案例

当前处于一个农业生产力提升与城镇化融合发展的一个关键时期，此前受耕作主体分散和生产水平的影响，我们的农业在解决了温饱水平之后，长时期处于碎片化作业与集约化程度不足的状态。随着近年智慧化应用积累和大模型的快速发展，“农业+大模型”的结合发展成为一种新的产业形态，也需要从体制到从业主体各个层面的改革以适应科技生产力的发展。农业与大模型的结合是新质生产力的体现，大模型在农业中的应用正是通过引入先进的人工智能技术，提升农业生产的智能化、精准化水平，从而创造新的价值和效率。丨。

2024-11-07 16:39:52 3114

原创什么是LLM？看这一篇就够了！

自从2022年12月 ChatGPT 横空面世以来，AI 领域获得了十足的关注和资本，其实AI的概念在早些年也火过一波，本轮 AI 热潮相比于之前的 AI，最大的区别在于：生成式。本文主要介绍大语言模型（Large Language Model，简称LLM）。通过海量文本训练的、能识别人类语言、执行语言类任务、拥有大量参数的模型，称之为大语言模型。

2024-08-20 20:44:43 2990

原创无需本地部署！免费使用开源大模型API

之前，我给大家分享过几篇关于如何在本地部署开源大模型以及应用场景的文章。比如说，给本地大模型添加知识库、API的调用等等。在这个过程中，有粉丝反馈自己不会部署，或者电脑配置不好，想知道还有没有办法使用这些开源大模型。今天就来分享一个免费且无门槛使用各种主流开源模型及其API的方法，让你不用在本地部署开源模型，也可以在各种第三方应用中调用这些模型，例如翻译插件、Dify的工作流、对话应用等等。这些场景下都可以用这个方法来省钱。我们今天要用的平台名字叫Groq。

2024-07-10 09:53:46 3303 1

原创 AI大模型·白皮书 | 2025年中国AI大模型产业市场前景及投资研究报告

今天分享的报告是《2025年中国AI大模型产业市场前景及投资研究报告》，版权归中商产业研究院所有。AI大模型是指在机器学习和人工智能领域中，具有庞大参数量和复杂结构的模型这些模型通常由大量的神经网络层组成，具有数百万或数十亿的参数，需要大量的计算资源和存储空间进行训练和推理。其中，通用大模型能够综合多种领域的数据和知识，进行全局性的分析和预测;行业大模型则针对于某个行业进行优化和训练，提供更加精准的解决方案。

2025-05-06 14:22:16 243

原创一文搞懂 AI Agent：从智能体到工作流全解析

AI Agent 就像你的「数字小管家」，而工作流就是它「干活的步骤清单」。简单任务用「单线程」，复杂任务用「并行」，想让它变聪明就用「循环优化」。适合用在「重复性高、步骤多」的场景（规划、客服、数据处理），但复杂或高风险的事（比如签合同、医疗诊断），最好最后检查一遍。现在你可以试试让手机里的智能助手（比如 Siri、小爱同学）做件小事，感受一下 Agent 工作流的魅力啦！

2025-05-06 14:11:56 930

原创大模型应用落地白皮书：企业AI转型行动指南（附下载）

大模型应用落地白皮书：企业AI转型行动指南》由火山引擎与IDC联合发布，核心观点围绕大模型技术与企业业务融合展开，旨在为企业AI转型提供指引。大模型加速从探索走向落地：大模型技术推动AI应用升级，企业对其关注度和投资持续增加，积极拓展试点范围。大模型为企业带来多维价值，涵盖员工、用户、营收和市场等方面，提升工作效率、创新用户体验、推动产品服务升级等，坚定了企业探索其潜力的决心。企业落地面临的挑战与机遇：大模型落地面临高成本、模型选配难、部署落地细节复杂、安全风险与可解释性等多重挑战。

2025-05-05 15:48:37 544

原创一文说清楚什么是预训练（Pre-Training）和微调（Fine-Tuning）

预训练是让AI模型在大规模数据上学习通用知识的过程，类似于学生的“基础教育”。微调是在预训练模型的基础上，针对特定任务进行进一步训练的过程，类似于学生的“专项培训”。预训练和微调的结合，使得AI模型能够从“通才”成长为“专才”，在各种任务中表现出色。

2025-05-05 15:43:25 691

原创大模型概念、技术与应用实践（140页PPT报告）

在数字化浪潮汹涌澎湃的今天，大模型犹如一颗耀眼的明星，迅速崛起并成为科技领域的璀璨焦点。从最初的理论探索，到如今广泛渗透于各行各业，大模型正以前所未有的速度改变着我们的生活与工作方式。它不仅是人工智能技术的一次重大飞跃，更是驱动经济增长、提升社会治理效率、加速科技创新的关键驱动力。本报告将深入探讨大模型的核心概念、原理特性及其丰富多样的应用实践案例，旨在帮助大家全面认识这一前沿技术，明确其在当前及未来发展中的核心地位与深远影响，并共同探索如何利用大模型的力量推动社会各项事业迈向新高度。

2025-05-04 11:30:00 456

原创大模型（LLM）蒸馏技术解析：应用、实现等等

LLM 蒸馏是一种旨在。

2025-05-04 09:15:00 1688

原创终于有人把大模型11种微调方法说清楚了！

前缀调优(PrefixTuning)是一种轻量级的微调替代方法，专门用于自然语言生成任务。前缀调优的灵感来自于语言模型提示，前缀就好像是“虚拟标记”一样，这种方法可在特定任务的上下文中引导模型生成文本。前缀调优的独特之处在于它不改变语言模型的参数，而是通过冻结LM参数，仅优化一系列连续的任务特定向量(即前缀)来实现优化任务，如图1所示。

2025-05-03 10:00:00 47

原创 3分钟搞懂AI大模型高频词：Token、RAG、RL…（附应用场景）

Token是AI处理文本的最小单位，相当于自然语言中的“字词片段”。例如“人工智能”可能被拆分为“人工”+“智能”两个Token，或保留为单个Token（不同模型分词规则不同）。DeepSeek官方也给出Token数和字数的大致换算比例如下：1 个英文字符 ≈ 0.3 个 token。1 个中文字符 ≈ 0.6 个 token。

2025-05-03 09:00:00 1729

原创必看！AI大模型使用攻略，一文读懂大模型常见的10个核心概念

如今高效智能的AI大模型，正如雨后春笋般破土而出，人们对于AI大模型的学习与探索之路，也愈发宽阔平坦。虽然AI工具已不再陌生，但其中关于AI Prompt、大模型的吞吐量、蒸馏与量化、私有化知识库等这些常见的专业术语，你又了解多少？这篇文章将帮助你快速掌握AI行业常见的核心概念。

2025-05-02 09:00:00 1246

原创人人都能学会的AI指南：从机器学习到大模型全流程解析（附PDF）

接下来是进阶篇，你将掌握RAG、Agent、Langchain、大模型微调和私有化部署，学习如何构建外挂知识库并和自己的企业相结合，学习如何使用langchain框架提高开发效率和代码质量、学习如何选择合适的基座模型并进行数据集的收集预处理以及具体的模型微调等等。最后呢，会给大家一个小福利，课程视频中的所有素材，有搭建AI开发环境资料包，还有学习计划表，几十上百G素材、电子书和课件等等，只要你能想到的素材，我这里几乎都有。所以我综合了大模型的所有知识点，给大家带来一套。我们这套大模型资料呢，会从。

2025-05-02 07:00:00 319

原创 Qwen3 全面发布：性能、部署与使用指南

Qwen3-32B使用 Hugging Face Transformers 框架，可以快速体验 Qwen3 模型。默认启用思考模式（），可根据需要调整。示例：使用 vLLM 快速部署API 接口地址默认：http://localhost:8000/v1。

2025-05-01 14:30:00 573

原创 LLM大型语言模型脑图 - 开发篇

基于大模型的开发是一个快速发展的领域，涵盖从需求分析到部署优化的完整流程。开发框架如Hugging Face、LangChain等提供了强大的工具支持，而开发方向则覆盖了对话系统、代码辅助、多模态应用等多个领域。未来，随着模型性能提升和计算成本降低，LLM将在更多行业中实现深度应用。

2025-05-01 13:45:00 800

原创附全文 | 《“机器人+人工智能”工业应用研究报告（2025）》

由中国信通院江苏研究院与苏州市机器人产业协会联合编制的《"机器人+人工智能"工业应用研究报告》正式发布。报告深度解析AI与机器人融合的技术演进路径，揭秘工业场景应用突破方向。

2025-05-01 09:45:00 281

原创一文入门垂域模型 SFT 微调

你将掌握RAG、Agent、Langchain、大模型微调和私有化部署，学习如何构建外挂知识库并和自己的企业相结合，学习如何使用langchain框架提高开发效率和代码质量、学习如何选择合适的基座模型并进行数据集的收集预处理以及具体的模型微调等等。最后呢，会给大家一个小福利，课程视频中的所有素材，有搭建AI开发环境资料包，还有学习计划表，几十上百G素材、电子书和课件等等，只要你能想到的素材，我这里几乎都有。，在小规模、专业化的数据上进一步优化模型，使其在特定任务和领域表现更好。

2025-04-30 22:28:43 959

原创信通院：“机器人+人工智能”工业应用研究报告2025 | 附PDF文件免费下载

随着数字经济的蓬勃发展，AI 技术正加速从虚拟空间向实体经济领域拓展，机器人作为 AI 技术的理想载体，凭借其高度的灵活性和强大的适应性，正在迅速发展并广泛应用于各个行业，成为推动产业升级和变革的重要力量。《“机器人+人工智能”工业应用研究报告（2025）》由信通院（江苏）科技创新研究院有限公司牵头编写，深入分析了“机器人+人工智能”在工业领域的应用现状、技术趋势及未来展望。

2025-04-30 13:59:39 871

原创最新最强开源模型 Qwen3 本地运行方法！ Windows+ollama+chatwise

千问在放假前扔出了一个重磅炸弹💣–Qwen3！Qwen3 在能力等能力上可以直接和 Gemini，chatgpt，Grok 最强模型掰手腕。模型支持开关深度思考能力，提供多种尺寸，可以在不同设备上运行，支持 119 种语言，还特别增强了智能体能力，支持 MCP。尤其是全部开源，提供了 0.6B 到235b 的全尺寸模型。非常适合在最小的模型只有523M。40亿参数的模型只有 5.2G，一张8G 的显卡，可以轻松运行。但是它的能力却可以匹敌。这不是了，必须在本地跑一跑了！

2025-04-30 13:45:18 872

原创【报告分享】2025年AI大模型教育行业白皮书（附下载）

在数字化浪潮的席卷下，教育行业正迎来一场前所未有的变革。2025年，AI大模型的崛起，如同一颗划破夜空的璀璨星辰，照亮了教育的未来。今天，就让我们一起深入探讨这份《2025年AI大模型教育行业白皮书》，看看AI大模型如何重塑教育的每一个角落。教育数字化并非一蹴而就，而是经历了漫长的发展历程。从最初的教育ICT建设，到教育信息化2.0，再到如今的数智教育时代，每一步都凝聚着教育工作者和科技人员的智慧与汗水。这一阶段以计算机和网络基础设施建设为主，推动教育资源的初步电子化。

2025-04-29 14:53:17 572

原创史上最强大模型Qwen3震撼来袭！直接成为大模型王炸！

Qwen3作为一款开源且性能卓越的混合推理模型，凭借其强大的技术特点和灵活的应用场景，正在引领全球AI技术的新潮流。其低成本、高性能和多语言支持能力，不仅为开发者和企业提供了一个强大的工具，也为全球AI生态的发展注入了新的活力。未来，随着更多优化和应用场景的落地，Qwen3有望在全球AI领域占据更加重要的地位。

2025-04-29 14:51:09 684

原创 2025年私域大模型部署白皮书解读（附下载）

4.1 市场展望• 供给侧：硬件架构革新、模型即服务生态成熟，供给端从“卖硬件”转向“卖解决方案+持续服务”。• 需求侧：从单点实验到全链渗透、数据-模型飞轮效应、从通用能力到领域专属、场景耦合度升级、颠覆性场景孵化。4.2 技术演进• 硬件架构升级：存算一体芯片设计、3D异构集成与先进封装、动态能效管理技术。• 模型能力突破：稀疏化与动态计算架构、量化与蒸馏的极致优化、多模态统一建模。4.3 行业发展。

2025-04-28 15:06:29 548

原创一文剖析大模型、RAG、Agent、MCP、Function Calling、知识库、向量数据库、知识图谱、AGI 的区别和联系

Function Calling 是一种强大的工具，它为大语言模型提供了与外部工具和服务交互的能力，从而解决了大模型知识更新停滞的问题。然而，它的局限性在于缺乏跨模型的一致性和平台依赖性。尽管如此，Function Calling 仍然是一个重要的技术，尤其是在需要快速实现特定功能时。未来，随着技术的不断发展，我们期待看到更多能够克服这些局限性的解决方案。

2025-04-28 15:00:31 1014

原创【大模型入门级】Agent 面试八股文，简单背一背

大模型 Agent（LLM Agent）是一种基于大型语言模型（LLM）的智能体，能够自主解析任务、调用工具、执行推理，并与环境交互。

2025-04-27 15:36:50 670

原创 RAGFlow 构建 Text2SQL 智能体：2 小时的实战之旅

经过两个小时的努力，我成功构建了一个 Text2SQL 智能体。这个过程虽然有些挑战，但也让我学到了很多东西。RAGFlow 是一个非常强大的工具，它可以帮助我们快速实现复杂的数据库查询功能。

2025-04-27 15:17:44 547

原创 DeepSeek企业落地应用讲义精华全版：比清华版更全面、更落地（258页 PPT 可编辑）

介绍了DeepSeek企业落地应用讲义精华全版的内容，包括特征价值篇、交互生成篇、智能增强篇、部署开发篇等。文中详细阐述了DeepSeek在企业中的应用，如特征价值、交互生成、智能增强、部署开发等方面的实践。此外，还介绍了DeepSeek的选人标准、组织模式、组织文化等，以及如何使用DeepSeek进行文本生成、行业调研报告撰写、PPT一键生成等。最后，文中还介绍了大模型在垂直领域使用时需要修改或增强的原因，以及检索增强生成RAG和微调Fine-tunning的选择，并详细介绍了微调的种类和相关工具框架。

2025-04-25 22:25:33 284

空空如也

空空如也