自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(31)
  • 收藏
  • 关注

原创 AI Agent到底是什么?相信这十个问答一定能解决你的疑问!

本文通过提取并梳理以上两篇文章中的技术术语和价值信息,并进行扩展,再以问答形式来呈现,希望通过这种方式,在加深使用者和开发者对 AI Agent 的了解方面,起到一些帮助。

2025-05-22 14:07:02 619

原创 全方位总结大模型技术与趋势:一文详解大模型,看完你就是LLM大师!

本篇文章旨在希望大家对大模型的本质、技术和发展趋势有简单的了解。由于近期大模型技术发展很快,这里对大模型的技术、本质及未来趋势进行总结和探讨时,水平有限,疏漏在所难免,请大家谅解。

2025-05-22 14:05:32 833

原创 零基础入门AI:一键本地运行各种开源大语言模型 - Ollama

Ollama 是一个可以在本地部署和管理开源大语言模型的框架,由于它极大的简化了开源大语言模型的安装和配置细节,一经推出就广受好评,目前已在github上获得了46k star。

2025-05-22 13:51:42 763

原创 Java开发者LLM实战——使用LangChain4j构建本地RAG系统

如果你真的想学习大模型,请不要去网上找那些零零碎碎的教程,真的很难学懂!你可以根据我这个学习路线和系统资料,制定一套学习计划,只要你肯花时间沉下心去学习,它们一定能帮到你!

2025-05-21 14:56:23 1019

原创 学习AI Agent你必须要了解的4种Agent设计模式!

无论是人类还是AI模型,学习都是一个持续的过程。然而,一个常见的问题是,AI模型能否像人类一样自我学习?根据近期的发展——它们可以。为了更好地理解这一点,让我们回顾大学时光,当时C++、Java和Python是我们必须掌握的主要编程语言,以在计算机科学领域脱颖而出。学习这些语言需要理解语法、语义、实际应用和问题解决能力。为了熟练掌握这些语言,我们不断练习(或者可以说接受训练)。此外,我们还从同学和教授那里学到了很多,对吧?同样,就像人类可以通过自己的思考、专业知识和其他媒介学习一样,大型语言模型(LLMs)

2025-05-21 14:06:11 724

原创 大模型入门:系统认识AI Agent的核心要素、设计模式以及未来发展方向

看了许多关于人工智能的学术文章与技术论文之后, 深切体会到,唯有将这些理论付诸实践,将其转化为文字和具体的代码,才能真正感受到当下大型语言模型(LLM)所蕴含的非凡魅力,这种从认识到实践的过程,不仅加深了技术理解,更是一场思想深度对话,Agent相关的研究还有很多。

2025-05-20 11:46:25 1258

原创 你真的看懂MCP大模型架构了吗?

企业要真正跑通“大模型”,不是单靠一个 LLM 就能搞定的,而是需要一整套“连接上下游、支撑大规模、多轮优化”的系统工程。今天这篇文章,我们就来深度解析MCP大模型架构的全景图,从技术底座到交互体验,带你一次性看懂企业级 AI 是怎么“跑起来”的!

2025-05-20 11:39:44 1139

原创 初学者大模型必学:降低大模型幻觉的六种方法

在当今人工智能领域,大语言模型(LLMs)已经成为了自然语言处理的核心力量。然而,随着模型规模的不断扩大,一个令人头疼的问题也逐渐浮幻觉(Hallucinations)。这些幻觉以各种形式出现,严重影响了模型输出的准确性和可靠性。**本文将深入探讨大语言模型幻觉的类型、成因,并结合实际案例,展示如何通过一系列技术手段解决这些问题。

2025-05-19 21:48:23 1433

原创 10分钟看明白爆火的本地知识库! 掌握本地知识库基本概念与RAG的完整架构

相信朋友都遇到过类似的困惑。AI大模型的普及,企业建设知识库的需求也与日俱增,但面对市面上林林总总的技术方案,却常常无所适从。本文将用最通俗的语言,帮你理清知识库建设的核心概念,让你在10分钟内建立起完整的技术认知,轻松应对知识库选型难题。

2025-05-18 10:15:00 1336

原创 大模型部署:Ollama+DeepSeek+AnythingLLM部署个人知识库完整分享

简单来说,ollama我理解为docker的方法部署服务,他的使用语法和docker也比较接近,deepseek就是一个训练好的模型,类似docker的镜像,跑在ollama软件上,但ollama缺少合适的界面,故使用AnythingLLM,当然也有其他的交互界面,比如Open webUI之类的,选择自己喜欢的就行,都是开源的,容易找到

2025-05-18 10:00:00 584

原创 初学者如何对大模型进行微调?看完这一篇你就懂了!

对于开发者来说,如果你有几块GPU显卡,那么就可以尝试微调了。不过在微调之前,我们要弄明白为什么要微调,大模型为什么不能直接用?

2025-05-17 09:15:00 533

原创 初学者必看:大白话解释大模型的技术原理,为什么它那么聪明?

“大模型”到底是什么?为什么它这么厉害?它是怎么做到的?这篇文章就用大白话,带您了解大模型的基本概念、工作原理、应用场景,以及它面临的挑战。

2025-05-17 09:00:00 822

原创 大模型AI Agent实践:七个关键步骤轻松学会打造商用AI Agent!

本文将为你提供一份详细的指南,分解构建 AI 代理的七个关键步骤:需求梳理、选择合适的软件、提示工程的实施、数据库的选择和管理、构建用户界面、进行测试评估,以及最后的部署发布。我们将一步步带你深入了解,让你能够更加顺利地开发出适合自己需求的人工智能助手。

2025-05-16 09:30:00 537

原创 大模型实战:从零打造一个MCP客户端,保姆级教程!

Anthropic开源了一套MCP协议,它为连接AI系统与数据源提供了一个通用的、开放的标准,用单一协议取代了碎片化的集成方式。本文教你从零打造一个MCP客户端。

2025-05-16 09:15:00 844

原创 神经网络算法解析:一篇文章带你彻底理解回归与分类

回归和分类是机器学习中两种基本的预测问题。它们的本质区别在于输出的类型:回归问题的输出是连续的数值,分类问题的输出是有限的、离散的类别标签。

2025-05-15 09:30:00 1707

原创 从零开始学大模型 AI Agent,看完这篇文章你就是LLM大师!

在学习AI智能体前,我们不妨先思考一个问题:为什么现在大家都在说AI智能体,它到底是不是AGI的最终展现形态?AGI,通用人工智能(Artificial General Intelligence),简单来说,它是一个可以像人类一样灵活地解决任何问题的超级AI。智能体,Agent,它是一种具有自主决策能力的人工智能系统,能感知环境、制定计划、采取行动,并根据反馈调整行为,如下图所示:

2025-05-15 09:00:00 841

原创 大模型技术:如何构建企业级 RAG 系统,七个常见的 RAG 故障点

虽然互联网上充斥着有关简单 RAG 系统的文章,但构建一个稳健的企业级解决方案的过程却往往充满未知。大多数构建者甚至不知道他们在构建 RAG 系统时最重要的决策是什么……但这篇博客不仅仅是理论上的旅程,它也是一个帮助您采取行动的实用指南!从保障措施对于确保安全的重要性到查询重写对用户体验的影响,我们将提供可操作的见解和真实世界的示例。无论您是经验丰富的开发人员还是引领团队的技术领导者,请系好安全带,准备深入探索前沿企业级 RAG 的复杂世界!

2025-05-14 09:45:00 552

原创 初学者入门AI Agent:使用扣子Coze制作一个智能询价客服,附完整案例

为了方便演示,对案例中的数据进行了简化及脱敏,同时对案例的交互流程进行了简化。在这个案例中,主要使用到了扣子Coze的“知识库”、“工作流”、“快捷指令”等功能,保姆级教程,直接嘴里喂饭!

2025-05-14 08:00:00 359

原创 DeepSeek不好用?那是你还不会这10个官方神级指令(建议收藏)

如果你真的想学习大模型,请不要去网上找那些零零碎碎的教程,真的很难学懂!你可以根据我这个学习路线和系统资料,制定一套学习计划,只要你肯花时间沉下心去学习,它们一定能帮到你!

2025-05-13 09:45:00 840

原创 终于有人说清楚了!DeepSeek三种部署模式的区别,到底哪个更适合我的业务?

市场上充斥着让人眼花缭乱的DeepSeek方案,用户极易陷入“参数对比”的泥潭,部署模式的选择正成为个行业决策层的核心焦虑点。公有云的弹性、私有化的安全、一体机的协同,看似是一道简单的三选一选择题,实则背后隐藏着技术架构与商业逻辑的复杂博弈。哪种模式更适合我的业务?成本如何?安全性是否有保障?

2025-05-13 09:00:00 797

原创 2025年想转行AI领域但不知从何开始?试试这五步!

我看了计算机科学家大卫·格维茨写的一篇博客,里面介绍了如果想从事AI行业,却不知道如何开始的话,可以走下面五步,从而达到转行的目的。因为这是个国外作家写的,跟我们国内的情况有一些出入,但是大思路是没有问题的。

2025-05-12 11:59:59 1176

原创 AI Agent应用全览:100个场景揭秘,来看看Agent能在你的行业做什么

AI Agent 在 11 个行业中常见的 100 个应用场景人工智能代理(AI Agent)的发展正在以前所未有的速度改变我们的生活和工作方式。从日常生活的小事到企业级的复杂决策,AI Agent 的应用场景广泛且多样。以下是 100 个 AI Agent 的创新应用场景,它们展示了 AI 技术如何渗透到我们生活的方方面面。

2025-05-12 11:56:04 1065

原创 大模型核心技术:企业级 AI Agent 系统落地架构设计剖析,建议收藏!

如果你真的想学习大模型,请不要去网上找那些零零碎碎的教程,真的很难学懂!你可以根据我这个学习路线和系统资料,制定一套学习计划,只要你肯花时间沉下心去学习,它们一定能帮到你!点击领取:2025最新最全AI大模型资料包:学习路线+书籍+视频+实战+案例…

2025-05-10 11:57:40 1020

原创 技术讲解:大模型应用过程中的记忆功能管理问题及解决方案

众所周知,大模型是没有记忆功能的,因此记忆管理就成为大模型应用过程中必不可少的一个环节;虽然说记忆管理说起来很简单,但在实际操作中还是存在很多问题。比如说,随着记忆的增加token成本的上升,大模型窗口的限制,记忆的存储问题等等。

2025-05-10 11:53:55 772

原创 这样图解Transformer应该没人看不懂了吧——多头注意力机制详解

本文将更进一步,深入剖析Transformer的核心——多头注意力(Multi-head Attention)机制。对自注意力、编码器-解码器注意力、注意力分数与掩码机制进行深度解析!

2025-05-09 14:59:34 1209

原创 一文带你彻底搞懂人工智能、机器学习、深度学习、大模型

在当今的技术讨论中,“人工智能”(AI)、“机器学习”(ML)、“深度学习”(DL)和“大模型”(LLM)等术语常被混用,以至于令人困惑。本文将简要梳理这些概念,帮助读者清晰理解它们的关系与区别。

2025-05-09 14:30:29 969

原创 万字详解:AI大模型入门到进阶学习的100条建议,收藏这一篇就够了!

如果你真的想学习大模型,请不要去网上找那些零零碎碎的教程,真的很难学懂!你可以根据我这个学习路线和系统资料,制定一套学习计划,只要你肯花时间沉下心去学习,它们一定能帮到你!点击领取:2025最新最全AI大模型资料包:学习路线+书籍+视频+实战+案例…

2025-05-07 11:55:02 1340

原创 大模型提示工程 vs 微调 vs RAG,大模型三种优化方式有什么区别?

如果你真的想学习大模型,请不要去网上找那些零零碎碎的教程,真的很难学懂!你可以根据我这个学习路线和系统资料,制定一套学习计划,只要你肯花时间沉下心去学习,它们一定能帮到你!点击领取:2025最新最全AI大模型资料包:学习路线+书籍+视频+实战+案例…

2025-05-07 11:52:42 850

原创 大模型是如何训练的?从数据准备、模型架构、训练方法到硬件支持全解析

如果你真的想学习大模型,请不要去网上找那些零零碎碎的教程,真的很难学懂!你可以根据我这个学习路线和系统资料,制定一套学习计划,只要你肯花时间沉下心去学习,它们一定能帮到你!点击领取:2025最新最全AI大模型资料包:学习路线+书籍+视频+实战+案例…

2025-05-06 20:09:14 646

原创 AI Agent(智能体)到底是什么?一文全面解析AI Agent的概念、原理与应用

AI Agent(智能体)是一种能够感知环境、进行决策并采取行动的智能系统,旨在达成特定目标。与传统的大型语言模型(LLM)相比,AI Agent不仅具备理解和生成文本的能力,还能够主动规划、实施行动并与环境进行交互。AI Agent代表了人工智能从"工具"向"助手"再到"代理"的进化过程,标志着AI正逐步从被动响应走向主动行动。随着技术的不断发展,AI Agent将在更多领域发挥作用,为人类提供更智能、更高效的服务。

2025-05-06 19:45:31 853

原创 AI大模型入门:手把手带你入门大模型,掌握大模型未来趋势及挑战!

当模型的训练数据和参数不断扩大,直到达到一定的临界规模后,会表现出一些未能预测的、更复杂的能力和特性。**「微调(Fine-tuning)」**是给大模型提供特定领域的标注数据集,对预训练的模型参数进行微小的调整,使其更好地完成特定任务。而参数较少(一般在百万级以下)、层数较浅的小模型,具有轻量级、高效率和易于部署的特点,适用于数据量较小、计算资源有限的垂直领域场景,如简单的文本分类、情感分析等任务。泛化能力,是指大模型通过“投喂”海量数据,可以学习复杂的模式和特征,可以对未见过的数据做出准确的预测。

2025-05-05 15:31:11 981

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除