自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(34)
  • 收藏
  • 关注

原创 本地部署大模型与基于RAG构建私有知识库,一步到位!

在人工智能领域,大语言模型如GPT系列、BERT等,以其强大的语言生成与理解能力,正在深刻改变着我们的工作与生活方式\[1\]。这些模型通过海量数据训练而成,能够执行从文本生成、问答系统到代码编写等多种任务。然而,由于这些模型往往部署于云端,这不禁引发人们对隐私保护、数据安全的担忧\[2\]。企业与研究机构开始寻求在本地环境部署大模型的方法\[3\],同时构建专属的私有知识库,以实现更高程度的控制和灵活性。

2025-05-25 08:15:00 232

原创 一次讲清楚什么是AI模型训练?到底在训练什么?

我们一直惊叹于AI能写文章、能做画、会编程,现在还能生成视频。从宏观上来看,一个完整的通用AI系统如下图所示,在最关键的模型网关处,调用我们已经训练好的模型,进行用户数据交互,反馈最终的结果。所以,结果的好坏,就取决于我们模型的能力水平,因此,2024年我们看到了市场上千模大战的场面,模型的泛化能力正在以天为单位高歌猛进。

2025-05-24 18:19:08 344

原创 大模型新风口:什么是 MoA,它与 MoE的区别是什么?

**真的存在所谓的SOTA模型吗?**答案是,如果针对榜单而言,那答案是确定的。如果针对现实的落地场景,那么基于不同的数据集训练的大模型必定是各有所长的。有些大语言模型擅长解决数学问题,有些适合创作,而另一些则更适合编码。

2025-05-23 21:12:43 936

原创 AI大模型落地的关键选择:到底是选RAG还是微调?这篇文章告诉你!

你是否曾经面临这样的困境:部门刚刚决定采用大语言模型解决业务痛点,但技术团队却陷入了"`到底该用RAG还是微调`"的激烈争论中?一边是`成本控制派`,坚持RAG轻量级方案;另一边是`性能至上派`,认为只有微调才能满足业务需求。 让我们跳出技术视角,用真实业务场景来理解这两种方案。

2025-05-23 21:09:27 318

原创 12张架构关系图可视化解析:MCP/RAG/Agent 设计模式全对照

MCP、RAG、Agent 这些概念最近热度飙升,成了 AI 领域的热门话题。然而,我发现身边不少朋友对这些概念还是一知半解。为了帮助大家更好地理解,**精心绘制了 12 张简单易懂的架构图解**。这些架构图解涵盖了**从 MCP 的提示混合机制,到 RAG 的知识检索增强,再到 Agent 的自主决策框架等多个方面。**

2025-05-22 13:45:28 625

原创 大模型Agent:创建AI Agent最常遇到的5大挑战及解决方案,建议收藏!

AI-Agent正变得越来越智能,它能够根据用户需求进行决策分析,并结合外部工具、自动化完成工作流程。然而,AI-Agent在实际应用过程中仍面临诸多挑战,例如:上下文维护、多步骤处理、外部工具等,这些挑战会影响AI-Agent的实用性。

2025-05-22 11:58:10 882

原创 千字长文!最通俗易懂的Transformer模型架构详解!(图文并茂)

2017 年 Google 在论文《Attention Is All You Need》中提出 Transformer 模型架构,该架构是基于 Encoder-Decoder (编码器-解码器)的架构。作为当下最先进的深度学习架构之一,Transformer 被广泛应用于自然语言处理领域,它不仅替代了以前流行的循环神经网络(RNN)和长短期记忆网络(LSTM),而且后来的 BERT、GPT-3 等网络架构也是基于 Transformer 架构演化而来。

2025-05-21 14:57:47 807

原创 大模型面试:一文梳理专家混合模型(MoE)面试常考题

本文将围绕 MoE 的两个主要组成部分——专家(Experts)和路由器(Router)——在典型的基于 LLM 架构中的应用展开讨论

2025-05-21 14:10:01 733

原创 一文讲清大模型:API、Function Call、MCP、MoE、MoA、Agent与多智能体系统的协作关系、工作机制

人工智能技术的快速发展催生了一系列创新架构和协作机制,形成了复杂而强大的AI技术栈。从基础的API接口到高级的多智能体系统,这些技术组件相互协作、相互促进,共同构建了现代AI应用的技术基础。本报告深入探讨API、Function Call、MCP、MoE、MoA、Agent与多智能体系统的工作机制、架构设计和协作关系,旨在全面呈现AI技术栈的发展现状和未来趋势。

2025-05-20 11:44:39 984

原创 AI大模型年度发展趋势报告解析,来看看这7大核心发展趋势!

中国工业互联网研究院全方位剖析大模型发展态势,从技术发展、生态建设、应用落地、商业模式等多维度深入研判,梳理出七大核心发展趋势。

2025-05-20 11:40:52 1365

原创 基于MCP快速打造高性能企业RAG系统,比RAG还好用!

在企业数字化转型浪潮中,如何有效管理和利用内部知识资产已成为关键挑战。随着大型语言模型(LLM)技术的成熟,检索增强生成(RAG)应用正逐渐成为连接企业知识与AI能力的重要桥梁。然而,传统RAG实现常面临检索质量不佳、实时更新困难等痛点问题。本文将通过实战案例,详细介绍如何**基于模型上下文协议(MCP)构建一套高性能企业RAG系统,帮助企业快速打造智能知识库应用。**

2025-05-19 21:45:17 1127

原创 一文了解模型精度(FP16、FP8等)、所需显存计算以及量化概念

在深度学习中,模型精度和量化技术直接影响模型的性能、资源消耗及部署效率。我们先聊浮点精度的概念,标准的FP英文全称是Floating Point,是IEEE定义的标准浮点数类型。由符号位(sign)、指数位(exponent)和小数位(fraction)三部分组成。和FP类似的还有TF32(全称Tensor Float 32),是英伟达提出的特殊数值类型,用于替换FP32,Google也提出BF16(Brain Float 16)。常见的数据精度有:

2025-05-18 10:00:00 591

原创 大模型如何在实际业务中落地?这篇文章讲清楚从应用场景到技术支持的完整路径

随着人工智能技术的迅猛发展,大模型逐渐成为推动各行业智能化转型的核心动力之一。大模型不仅可以处理大量数据,进行复杂任务的自动化,还能通过微调、蒸馏等技术在特定场景中表现出色。本文将结合大模型产品架构图,详细解读每一个组成模块,帮助读者理解从应用场景到技术支持的完整路径,洞察大模型如何在实际业务中落地。

2025-05-18 09:30:00 936

原创 大模型Dify案例分享-基于文本模型实现Fine-tune 语料构造工作流

微调(Fine-tuning)是指在已经预训练好的大规模模型基础上,通过进一步训练来适应特定任务或数据集的过程。这一过程体现了迁移学习的思想,即利用预训练模型在通用数据上学习到的知识,通过微调使其更好地服务于特定的应用场景.

2025-05-17 09:30:00 954

原创 初学者入门大模型必学Transformer:从原理到实践,揭开大模型的核心奥秘

本文将从基础概念、模型流程、关键模块、训练机制与实际应用场景五个方面,为你详细揭开Transformer的神秘面纱。

2025-05-17 08:30:00 558

原创 万字详解:小白也能懂的混合专家模型(MoE)

混合专家模型(MoE)作为一种强大的模型架构,正在成为大模型时代的热门话题。本文将带你深入了解MoE的神秘面纱,从其基本概念、核心组件,到训练方法和应用场景,用通俗易懂的语言和生动的实例,让你即使没有深厚的技术背景,也能轻松掌握MoE的关键技术细节。

2025-05-16 09:15:00 812

原创 大模型学习之prompt工程,什么是prompt?什么是prompt工程?

在与大模型进行交流的过程中,由于用户经验不足、模型差异性会出现Prompt指令不当的问题,因此需要通过Prompt工程,使用户能够控制模型的输出,使其生成相关、准确且高质量的文本。这与机器学习的过程类似,需要进行迭代。

2025-05-16 09:00:00 865

原创 你的RAG系统真的达标了吗?生产环境RAG成功的7大关键指标

在企业或者单位内部,我们搞了个RAG应用,塞进去一堆文档,想着能给团队提供又快又准的信息。刚开始,那感觉简直像变魔术一样神奇!但大家都知道,大模型总有穿帮的时候,现实总会给你当头一棒。

2025-05-15 09:45:00 615

原创 AI大模型到底是什么?小白也能看懂的科普贴

从去年到今年,大模型、chatGPT等概念和技术越来越火,但是像笔者一样的技术小白一直对大模型是一种似懂非懂的状态。鉴于最近在做基于大模型和Agent的上层AI应用,如若不了解底层概念,始终还是会限制产品层的能力,因此,最近2周零散时间读完了这本由复旦团队出版的《大规模语言模型:从理论到实践》,基本涉及到了大模型入门所需的核心框架内容,适合扫盲看。因此,基于这本书的核心框架,来结合自己的理解聊一聊大模型到底是什么?

2025-05-15 09:15:00 967

原创 RAG+AI工作流+Agent:LLM框架该如何选择,全面对比MaxKB、Dify、FastGPT、RagFlow、Anything-LLM,以及更多推荐

RAG+AI工作流+Agent:LLM框架该如何选择,全面对比MaxKB、Dify、FastGPT、RagFlow、Anything-LLM,以及更多推荐

2025-05-14 09:00:00 907

原创 初学者入门大模型:4种革新性AI Agent工作流设计模式全解析

AI Agent是指能够在特定环境中自主执行任务的人工智能系统,不仅接收任务,还自主制定和执行工作计划,并在过程中不断自我评估和调整,类似于人类在创造性任务中的思考和修正过程。AI Agent的四种关键设计模式是实现高效执行复杂任务的基础,共同构成了AI Agent的能力框架。本文将深入解析这四种关键设计模式。

2025-05-14 09:00:00 693

原创 一文彻底搞懂大模型 - 基于人类反馈的强化学习(RLHF)

随着大型语言模型(LLM)的快速发展,如何使这些模型更好地理解和满足人类的需求成为了一个关键问题。传统的训练方法往往依赖于大规模的语料库和基于规则的损失函数** ,但这在处理复杂、主观和依赖上下文的任务时存在局限性。因此,** 基于人类反馈的强化学习(Reinforcement Learning from Human Feedback,RLHF)应运而生,为模型的训练提供了一种新的思路。

2025-05-13 09:00:00 642

原创 五分钟带你彻底搞懂AI 大模型微调——Fine-tuning三种微调方式

在生成式AI和大语言大模型(如GPT、LLaMA)的广泛应用中,微调(Fine-tuning)作为模型适应特定任务的关键步骤,其重要性不言而喻。以下将详细介绍三种流行的微调方式:Prompt-tuning、Prefix-tuning和LoRA,深入理解每种方法的原理、特点及应用场景。

2025-05-13 09:00:00 828

原创 写给初学者的AI大模型应用指南:AI Agent智能体从入门到进阶

RAG(检索增强生成)和 Agent(智能体)在大模型应用领域无疑是备受推崇和寄予厚望的两大主流形态。本文使用浅显易懂的语言,帮助您迅速了解 AI Agent 智能体。

2025-05-12 14:14:56 864

原创 如何成为一名成功的AI产品经理:从传统产品到AI产品的转型之路

在当今数字化时代,人工智能(AI)已经成为推动各行各业创新的核心力量。越来越多的传统产品开始向智能化转型,AI技术的应用不仅提升了用户体验,还为企业带来了巨大的商业价值。作为产品经理,如何将传统产品转变为AI产品,并在这个过程中实现个人的职业转型,成为了许多人的关注焦点。本文将结合实际经验,为您详细解析AI产品经理的工作流程、学习路径以及成功的关键要素。无论你是刚刚接触AI的新手,还是已经在传统产品领域有所建树的产品经理,这篇文章都将为你提供宝贵的指导和启发。

2025-05-12 11:53:19 955

原创 无需任何AI和数学知识背景,手把手带你学会大模型应用开发(下篇),小白也能轻松入门!

前面举了联网搜索和查询天气的例子,它们都很简单,主要是为了阐明应用的开发流程,并没有发挥LLM更深入的能力。LLM真正的长处是它的**理解、推理和对于问题的泛化能力**,如果能把它运用到具体业务中,让它学习业务知识,则能发挥巨大的价值。 目前绝大多数对大模型的应用,都是在尝试**“教会”**大模型特定领域知识,再基于大模型的泛化推理能力,去解决一些实际问题。运用的最多的就是知识问答场景和编程助手,比如智能客服、wiki百事通、Copilot。

2025-05-10 11:46:32 736

原创 无需任何AI和数学知识背景,手把手带你学会大模型应用开发(上篇),小白也能轻松入门!

最近几年,大模型在技术领域的火热程度属于一骑绝尘遥遥领先,它已经深刻地影响了“编程”领域,且正在各个领域迅速渗透。与此同时,普通开发者也变得非常地焦虑,因为实实在在感受到了它强大的威力,担心哪天自己就被取代。与其担忧,我们不如主动拥抱这种技术变革。

2025-05-10 11:34:35 914

原创 一张图看懂AI技术架构!开发、训练、部署全链路深度解析!

本文基于AI技术架构全景图,详细解析了AI开发工具、AI平台、AI算力与框架、智能运维等四大部分。只有构建一个完善的AI架构,企业才能确保AI系统高效运行,实现真正的商业价值。希望本文的解析能帮助您更好地理解AI技术架构,为AI项目提供有力支持!如果你真的想学习大模型,请不要去网上找那些零零碎碎的教程,真的很难学懂!你可以根据我这个学习路线和系统资料,制定一套学习计划,只要你肯花时间沉下心去学习,它们一定能帮到你!点击领取:2025最新最全AI大模型资料包:学习路线+书籍+视频+实战+案例…

2025-05-09 15:10:23 826

原创 LLaMA-Factory 具体实践大模型训练的三个阶段:预训练、监督微调和偏好纠正,看完这篇你就是LLM大师!

根据LLaMa-Factory的README,我们需要在中按照以下格式注册自定义的数据集。"数据集名称": { "file_name": "data.json", "columns": { "prompt": "text" } }我们在在},在中,注册新添加的数据集。},如果你真的想学习大模型,请不要去网上找那些零零碎碎的教程,真的很难学懂!你可以根据我这个学习路线和系统资料,制定一套学习计划,只要你肯花时间沉下心去学习,它们一定能帮到你!

2025-05-09 14:15:51 1035

原创 AI大模型入门学习:一分钟带你了解大模型的基础概念,建议收藏!

如果你真的想学习大模型,请不要去网上找那些零零碎碎的教程,真的很难学懂!你可以根据我这个学习路线和系统资料,制定一套学习计划,只要你肯花时间沉下心去学习,它们一定能帮到你!点击领取:2025最新最全AI大模型资料包:学习路线+书籍+视频+实战+案例…

2025-05-07 11:48:24 715

原创 一文彻底搞懂什么是LangChain?从入门到精通,看这篇就足够了!

LangChain是一个专门为利用语言模型创建应用程序而设计的全面框架。它的主要目标是帮助开发人员轻松构建基于语言模型的应用。虽然LangChain与多种语言模型兼容,但它特别与OpenAI ChatGPT无缝集成,从中受益于其先进功能。本文学习知识点: 语言模型(LLMs)和LangChain。提示工程。语言模型的内存。语言模型的链式结构。LangChain索引。工具和代理。如果你真的想学习大模型,请不要去网上找那些零零碎碎的教程,真的很难学懂!

2025-05-07 11:46:13 1147

原创 基于AI技术架构全景图,深度解析开发、训练、部署全链路!

本文基于AI技术架构全景图,详细解析了AI开发工具、AI平台、AI算力与框架、智能运维等四大部分。只有构建一个完善的AI架构,企业才能确保AI系统高效运行,实现真正的商业价值。希望本文的解析能帮助您更好地理解AI技术架构,为AI项目提供有力支持!如果你真的想学习大模型,请不要去网上找那些零零碎碎的教程,真的很难学懂!你可以根据我这个学习路线和系统资料,制定一套学习计划,只要你肯花时间沉下心去学习,它们一定能帮到你!点击领取:2025最新最全AI大模型资料包:学习路线+书籍+视频+实战+案例…

2025-05-06 20:03:58 942

原创 AI大模型中的Token和Embedding到底是啥?看完这篇你就懂了!

如果你真的想学习大模型,请不要去网上找那些零零碎碎的教程,真的很难学懂!你可以根据我这个学习路线和系统资料,制定一套学习计划,只要你肯花时间沉下心去学习,它们一定能帮到你!点击领取:2025最新最全AI大模型资料包:学习路线+书籍+视频+实战+案例…

2025-05-06 19:50:03 811

原创 AI大模型入门到进阶的学习方法论,别再做无用功了!

如果你真的想学习大模型,请不要去网上找那些零零碎碎的教程,真的很难学懂!你可以根据我这个学习路线和系统资料,制定一套学习计划,只要你肯花时间沉下心去学习,它们一定能帮到你!点击领取:2025最新最全AI大模型资料包:学习路线+书籍+视频+实战+案例…

2025-05-05 15:07:36 991

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除