- 博客(592)
- 收藏
- 关注
原创 【AI大模型】LangChain + 模型上下文协议(MCP):AI 智能体 Demo
在基于大语言模型构建应用时,一个核心痛点是 数据与工具的接入困难。模型虽然能力强大,但通常处于“沙盒”状态,无法直接访问外部环境。为此,RAG(检索增强生成)、微调、插件等方案陆续诞生。而 MCP 的目标正是统一接口协议,以便标准化集成上下文、工具、服务与数据源。
2025-05-04 08:00:00
448
原创 DeepSeek+RagFlow搭建企业级知识库:Docker镜像构建基础篇
随着AI技术的火热发展,企业和个人用户需要搭建知识库的需求越来越迫切。如果自己动手搭建一个功能强大的知识库对于非专业技术人员来说可能面临挑战,更别说那些非专业人士了。我在网上看了大量相关的教程,大多数都是搬砖,偶尔看到一些非搬砖大佬写的教程,总会省略一些细节,导致很多人就算面对教程也是各种踩坑,折腾很久最后也都放弃了。本文主要内容是利用RagFlow开源框架来搭建企业级知识库。初衷是考虑到大多数,非技术人员也能搭建,所以我从构建镜像到安装整个过程,为大家提供傻瓜式的教程。
2025-05-03 08:00:00
698
原创 比肩DeepSeek-R1的QwQ-32B,单卡击碎6710亿参数资源枷锁?本地部署+函数工具调用实战教程!小参数推理模型榜一!
在AI大模型军备竞赛中,阿里云近期推出的QwQ-32B推理模型引发了行业震动。这款仅320亿参数的稠密模型,在数学推理(AIME24)和代码能力(LiveCodeBench)等核心指标上,竟与6710亿参数的DeepSeek-R1不相伯仲。
2025-05-02 08:00:00
921
原创 DeepSeek服务器繁忙?别慌,试试这几个方法!
据说DeepSeek三天内的访问量相当于整个欧洲互联网三天的总和!所以,DeepSeek卡死在所难免,其实我今天也试了n多次,只有几次成功,等来的永远都是那句“服务器繁忙,请稍后再试”。于是,我就学着网上的方法去各大AI平台统统都问了个遍。
2025-05-01 08:00:00
488
原创 最强开源大模型?Qwen3 系列深度解析 + 本地部署指南!看到就是赚到!!
Qwen3(通义千问3)是阿里云Qwen团队推出的新一代开源大语言模型系列,涵盖密集模型和混合专家(MoE)模型多个规模。本次发布共开源了 6 个密集模型和 2 个 MoE 模型,参数量从 6亿 到 2350亿 不等。其中密集模型包括约0.6B、1.7B、4B、8B、14B和32B参数版本,MoE模型包括总参数约30B(激活参数3B)和235B(激活参数22B)的两种。所有模型均采用Apache 2.0开源许可,开发者可自由下载使用。
2025-04-30 11:27:36
748
原创 别只关注Qwen3参数量,这些Agents细节才是最大亮点!
除此之外,还特地提到了在Agent能力上做了大幅的增强。博客中特地强调了使用Qwen-Agents项目发挥Qwen3的最强能力。 首先这个项目是个23年的老项目了。最早开源的时候,代码质量很差,简单看过。这2年也在陆陆续续的更新,今天仔细的扒一下源码,发现它的变化还挺大的,所以给家人们分享一下~
2025-04-30 10:20:41
549
原创 真实场景下落地RAG的十条建议及RAG中如何提升个性化?看完这一篇你就懂了!!
RAG无处不在、无孔不入,却又缝缝补补,且出现了诸如GraphRAG、多模态RAG、Deepresearch等许多变体。RAG的方案人手一份,但是依旧在实际落地过程中出现各类问题。
2025-04-29 11:55:17
520
1
原创 2万字长文!从Transformer到DeepSeek位置编码,全面了解「大模型位置编码」!
位置编码是大模型架构的重要组成部分。本文从位置编码的起源开始介绍,详细介绍Transformer位置编码、相对位置编码、重点介绍了旋转位置编码RoFE、ALiBI位置编码等,最后介绍DeepSeek位置编码,希望能够帮你对位置编码有一个详细的了解。文章结构如下:
2025-04-29 11:24:48
1004
原创 一文剖析大模型、RAG、Agent、MCP、Function Calling、知识库、向量数据库、知识图谱、AGI 的区别和联系
我们要把 AI 大模型当做人的大脑,因此调用 AI 大模型,相当于调用一个人,把 AI 大模型当人看,TA 懂人话、TA 说人话、TA 会直接给出结果,但结果不一定正确。因此在 AI 大模型的推理基础上,通过 RAG、Agent、MCP、Function Calling、知识库、向量数据库、知识图谱等技术手段实现了真正的 AGI(通用人工智能)。这些技术到底有哪些区别和联系,下图作了横向对比,接下来我们详细剖析。
2025-04-28 11:42:41
880
原创 AI大模型综述:大语言模型Agent在金融交易中的应用与展望
近年来,大语言模型(LLM)在自然语言处理领域取得了突破性进展,展现出强大的文本理解与策略生成能力,为金融交易这一高复杂度、高竞争性的领域带来了前所未有的应用前景。传统金融算法虽在结构化数据建模方面具有优势,但在处理非结构化文本、多模态信息融合及实时决策等方面仍存在明显不足。LLM的兴起为解决上述问题提供了新思路,其能够高效处理并整合新闻、财报、分析师观点等多源信息,为交易决策提供有力支持。本文系统回顾了LLM作为交易智能体(Agent)在金融领域的应用进展,重点探讨其在策略生成与因子挖掘中的双重角色,涵盖
2025-04-28 11:09:33
1002
原创 什么是 AI Agent?简要介绍与构建指南,零基础小白看这一篇就够了!!
下一件大事? Gartner 认为 AI Agent 将引领未来。OpenAI、Nvidia 和 Microsoft 都在下注,就连在 AI 领域一直比较低调的 Salesforce 也开始布局。这一趋势确实正在快速起飞。
2025-04-27 11:04:54
535
原创 图解AI大模型三大核心技术:RAG、大模型、智能体,全程干货,零基础小白也能看懂!!
为了帮助更多热爱技术、渴望成长的朋友,我特别整理了一份涵盖大模型领域的宝贵资料集。这些资料不仅是我多年积累的心血结晶,也是我在行业一线实战经验的总结。这些学习资料不仅深入浅出,而且非常实用,让大家系统而高效地掌握AI大模型的各个知识点。如果你愿意花时间沉下心来学习,相信它们一定能为你提供实质性的帮助。这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费。
2025-04-27 10:23:53
288
原创 dify+新版DeepSeek V3,知识库再次起飞!确实可以封神了
如果您的知识库数量非常庞大,推荐使用minimax-01(因为它有最长上下文-400万tokens,而且比deepseek API还便宜)如果您的知识库数据量一般,推荐直接上新版DeepSeek V3。
2025-04-25 10:56:56
928
原创 一文搞懂:RAG、Agent与多模态的行业实践与未来趋势
大模型技术正加速渗透至产业核心场景,成为驱动数字化转型的智能引擎。全球机器学习大会(ML-Summit)聚焦大模型技术的创新突破与产业实践,深入探讨其前沿方向与落地路径。作为AI发展的核心驱动力,检索增强生成(RAG) 通过动态知识融合技术突破大模型的静态知识边界;智能体(Agent) 借助自主决策与多任务协同能力重构人机协作范式;多模态大模型则依托跨模态语义理解技术解锁复杂场景的落地潜力。三者协同演进,不仅攻克了数据时效性、隐私安全与专业适配等关键难题,更在医疗诊断、金融风控、智能制造等领域催生从效率革新
2025-04-25 10:09:29
894
原创 AI Agent(或者LLM Agent)深度讲解——组成、方法、案例及展望
AI Agent是一种超越简单文本生成的人工智能系统。它使用大型语言模型(LLM)作为其核心计算引擎,使其能够进行对话、执行任务、推理并展现一定程度的自主性。简而言之,Agent是一个具有复杂推理能力、记忆和执行任务手段的系统。
2025-04-24 11:33:50
693
原创 AI王炸:MCP服务端客户端的完整实现,收藏这一篇就够了!!
试想一下,如果要想在现有应用上构建,让AI读取引用我们功能和数据,该怎么办,比如询问某个城市的天气,我们希望AI能调用天气函数返回相应结果,这时MCP (Model Context Protocol)就可以派上用场了,它相当于我们电脑的USB-C接口,提供了一个标准方式让AI模型连接不同的应用和工具。 我们可以建一个MUP Server来处理这类业务,比如市面上已有各类MUP Server,比较典型的高德地图MCP,除此之外,还有旅行交通的 AirbnbMCPServer,提供房源问询,版本控制的 gitl
2025-04-24 10:34:40
596
原创 一文搞懂大模型、RAG、函数调用、Agent、知识库、向量数据库、知识图谱、AGI的区别和联系!!
我们要把 AI 大模型当做人的大脑,因此调用 AI 大模型,相当于调用一个人,把 AI 大模型当人看,TA 懂人话、TA 说人话、TA 会直接给出结果,但结果不一定正确。因此在 AI 大模型的推理基础上,通过 RAG、Agent、知识库、向量数据库、知识图谱等技术手段实现了真正的 AGI(通用人工智能)。这些技术到底有哪些区别和联系,下图作了横向对比,接下来我们详细剖析下。
2025-04-23 19:36:34
699
原创 【AI大模型】LangChain MCP适配器:MCP工具与LangChain 无缝集成的技术奥秘!
AI行业现在已经火爆成这个样子,被宣传的可以说是无所不能,但是,我相信仍然有很多小伙伴用AI工具只是限于聊天,提问……这一类极其简单的应用场景,这不是极大的浪费了AI给我的红利吗?
2025-04-23 11:58:36
939
原创 首篇MCP技术生态全面综述:核心组件、工作流程、生命周期,建议收藏!!
模型上下文协议(MCP):一种标准化接口,旨在实现AI模型与外部工具和资源之间的无缝交互,打破数据孤岛,促进不同系统之间的互操作性。在MCP出现之前,AI应用与外部工具的交互依赖于手动API连接、插件接口和Agent框架等方法,这些方法存在复杂性高、可扩展性差等问题
2025-04-23 11:24:08
645
原创 居然可以这样理解AI Agent,中学生都能看懂!
AI Agent-人工智能代理,是人工智能领域中的一个重要的概念,学会理解并使用它,是学习大模型应用开发的必经之路。本篇我将用通俗易懂的方式为各位同学介绍一下AI Agent,目的是让大家轻松上手AI Agent,打开一扇大语言模型进阶之门。
2025-04-22 19:47:00
780
原创 AI知识库爆火!多模态能力应用,保姆级教程来了!建议收藏!!
现在大家经常使用 DeepSeek 等通用大模型。但是用着用着就会发现他们就像一个啥都懂但不太精的学霸,啥都能聊几句,但可能包含错误信息。这时,个人的知识库就很重要。有知识库的大模型就像在学霸的基础上,给它塞了一堆专业资料。在遇到专业问题时,它会先翻自己的“小抄本”(知识库),回答更靠谱。
2025-04-22 11:39:04
522
原创 【AI大模型】检索增强生成(RAG)深度教程,收藏这一篇就够了!!
检索增强生成(Retrieval-Augmented Generation,简称 RAG)指在大型语言模型(LLM)的生成过程中,引入外部知识检索,以提高回答的准确性和可靠性。通过让LLM在生成回答时参考外部知识库的信息,RAG技术可以有效减少模型产生事实性错误(即所谓的“幻觉”)并提升答案的事实正确性。典型的RAG系统包含四个基本组件:嵌入模型、向量数据库、提示模板以及生成式LLM。在查询时,系统会先将用户查询通过嵌入模型编码成向量表示,然后在向量数据库中检索出与查询最相关的文档片段,将这些片段填充到预先
2025-04-22 10:45:15
756
原创 【搭建AI大模型】本地私有化RAG知识库搭建—基于Ollama+AnythingLLM保姆级教程
检索增强生成(Retrieval-Augmented Generation,RAG)是一种结合了信息检索和语言模型的技术,它通过从大规模的知识库中检索相关信息,并利用这些信息来指导语言模型生成更准确和深入的答案。这种方法在2020年由Meta AI研究人员提出,旨在解决大型语言模型(LLM)在信息滞后、模型幻觉、私有数据匮乏和内容不可追溯等问题。
2025-04-21 19:49:53
246
原创 【AI大模型】0基础也能听懂:从预训练到SFT,对话模型技术栈深度拆解!
当你和deepseek对话的时候,你有没有想过,这家伙是怎么从一堆代码变成“会说话”的?这个过程听起来可能有点复杂,但其实可以用很直白的方式讲清楚。简单来说,从基座模型到对话模型的转变需要经过四个步骤:预训练基础模型、任务适应微调(SFT)、人类反馈强化学习(RLHF),以及部署和持续优化。下面,我们就一步步拆解这个过程,看看它是怎么实现的。
2025-04-21 11:51:15
933
原创 【AI大模型】Dify平台如何做检索增强生成(RAG)?看完这一篇你就懂了
RAG(Retrieval-Augmented Generation) 是一种结合了信息检索和文本生成的自然语言处理(NLP)技术,旨在通过动态引入外部知识来提升生成模型的准确性和可靠性。它的核心思想是:先检索相关信息,再生成回答。
2025-04-21 11:19:57
991
原创 深度讲解AI大模型原理,它到底是如何工作的,看完这篇你就懂了!!
现在很多朋友都在研究AI大模型;对各个公司的大模型更是数如家珍。“chatgpt、Claude、Gemini、Llama3、文心一言、千问…”国外的、国内的、开源的、不开源的;只要出来一个大模型,就要注册,试一试效果。
2025-04-20 08:00:00
1399
原创 融合LSTM与Transformer做时间序列预测,发高分轻轻松松!收藏这一篇就够了!!
LSTM结合Transformer,在时间序列预测上效果拔群! 不仅巧妙融合了二者的优势,还构建了一个强大而灵活的预测框架,为我们处理复杂时间序列数据提供了更牛x的工具。这方向如今是深度学习领域的热门研究主题,前景非常可观,在工业物联网(如设备故障预警)、智慧城市(如交通流量预测)、生物医学、环境科学(如气象预测)等领域都有广泛应用。相关成果频繁发表于顶会顶刊,尤其是跨学科相关的。
2025-04-19 08:00:00
689
原创 一文带你搞清楚AI领域的高频术语!RAG、Agent、知识库、向量数据库、知识图谱、Prompt...都是在讲啥?
随着AI人工智能技术的不断发展,一些领域有关的概念和缩写总是出现在各种文章里,像是Prompt Engineering、Agent 智能体、知识库、向量数据库、RAG 以及知识图谱等等,但是这些技术和概念也的的确确在AI大模型的发展中扮演着至关重要的角色。这些技术元素在多样化的形态中相互协作,共同推动 AI 技术持续向前发展。在这篇文章中,我们将深入探讨包括但不限于以上这些总是与大模型搭配出现的高频词汇,白话了解下这几种技术背后的含义。
2025-04-18 11:43:40
600
原创 MCP协议推动智能体爆发?三大要素深度解析(万字调研总结)
智谱在中关村论坛年会上发布了其最新产品——AutoGLM沉思。这款智能体被描述为全球首个集深度研究(Deep Research)与实际操作能力于一体的AI Agent,真正实现了"边想边干"的功能。智谱计划于2025年4月14日开源AutoGLM沉思的核心链路模型和技术。
2025-04-18 10:37:44
1029
原创 【AI大模型部署】三分钟让你学会使用Dify接入Ollama部署的本地大模型!看到就是赚到!!
三分钟让你学会使用Dify接入Ollama部署的本地大模型!
2025-04-17 11:55:22
318
原创 【AI大模型】LLM中的Token和Embedding到底是啥?看完这一篇你就懂了!!
大多数 NLP 系统都会对这些Tokens执行一些操作,以完成特定任务。例如,我们可以设计一个系统来处理一串Tokens并预测下一个Token。我们还可以将Tokens转换为语音表示,作为文本到语音系统的一部分。我们还可以完成许多其他 NLP 任务,如关键词提取、翻译任务等。
2025-04-17 10:45:45
917
原创 大模型知识库——检索增强(RAG)技术与向量数据库的选择
“ RAG的核心在于准确与快速的检索 ”在之前关于RAG技术的文章中有介绍过知识库与检索增强的关系;也简单介绍了RAG的使用场景。而RAG和向量数据库的实现原理,以及怎么选择向量数据库,是在智能客服,推荐系统等领域必须要解决的一个问题。
2025-04-16 11:43:58
816
原创 DeepSeek-R1大模型本地部署的三种方式,总有一种适合你!
由于 DeepSeek-R1 爆火,导致 DeepSeek 官网用起来非常卡(至 2025 年 2 月 2 日),因此催生出了很多本地部署的需求。而这里我选用了三种最常用的部署方式,从普通人测试使用到工业界部署,让你一次性掌握大模型的部署方式。
2025-04-16 11:00:02
645
原创 LangChain+RAG+Agent本地部署DeepSeek-R1商用级知识库,完美实现低代码可视化流程编排
随着大语言模型和RAG技术的快速发展,AI知识库系统正在全面渗透各行各业。目前,我们已经在多个领域见证了其成功应用,包括跨境电商平台的智能客服、教育机构的个性化学习助手、医疗机构的诊断支持系统,以及餐饮行业的智能点餐服务等实际落地案例。
2025-04-15 14:31:44
981
原创 啊?强大的Reasoning模型仍需好的prompt,性能暴增23%!
过去人们认为,像ChatGPT这类“大脑发达”的LLM模型,只需简单指令就能完美执行任务。但这篇论文通过事件提取任务(例如从新闻中识别“公司破产”“法律诉讼”等事件)证明:即便是最先进的大型推理模型(LRM),也需要精心设计的“说明书”——即Prompt。
2025-04-15 11:40:26
816
原创 如果你连LLM(大语言模型)是如何生成文本的都不懂,就别说你会AI!
你是不是也曾在朋友面前自信满满地说:“AI我可太熟了!”然后随便丢一句“写篇短文”给大模型,坐等它秒出结果?但你有没有想过,那几秒钟里,AI到底干了什么?从你敲下的几个字,到屏幕上蹦出的流畅句子,这背后可不是什么“魔法”。如果你连LLM(大语言模型)如何生成文本都不清楚,还好意思说自己懂AI?别急,今天我就带你拆开这台“写作机器”,用最直白的方式讲清楚每个步骤,看完你再吹牛,至少底气足点!
2025-04-14 11:40:26
994
原创 【AI大模型】LLMs.txt:让大模型更懂你的 Web 文档
您可能已经留意到,近期不少开发工具都在其文档中新增了对 LLMs.txt 的支持。这个拟议中的 Web 标准正快速获得业界的认可,但它究竟是什么,又为何如此关键?不同于专为搜索引擎设计的 robots.txt 和 sitemap.xml,LLMs.txt 专门针对 LLM 推理引擎进行了优化。它以一种易于 LLM 推理引擎理解的方式,提供了网站的详细信息。那么,LLMs.txt 是如何在短时间内从一项提案迅速演变为行业趋势的呢?
2025-04-14 11:01:40
919
原创 DeepSeek:医疗行业AI新宠走红的原因及对医院的影响,建议收藏起来慢慢学!!
关于AI,ChatGPT出来其实都挺火的,但医疗行业整体感觉还是属于不温不火的状态,很多医院也在考察和试点,但基本都是想的多说的多,做的少。为什么会这样,我想主要还是原来落地还比较难,落地效果也不佳!那为什么DeepSeek一出来就爆火了,所有医院突然都觉得之前想做但做不了的,现在好像可以实现了,究其原因是什么?我的理解,对比原有的国内外一些知名的通用大模型,DeepSeek有四个核心优势:
2025-04-13 08:00:00
896
1
原创 【AI大模型福报厂面试真题】QKV都讲不清,还敢在简历写“精通Transformer”?
在AI浪潮席卷全球的今天,Transformer模型早已成为技术圈的“顶流”,从自然语言处理的惊艳表现到图像识别的突破性应用,它无处不在,无所不能。简历上那一行“精通Transformer”,仿佛是一张通往大厂的门票,闪耀着求职者的野心与自信。可当面试官微微一笑,抛出那句轻描淡写却暗藏杀机的问题——“那你说说,Q、K、V在Transformer里到底是怎么回事?”——你的心跳是否会漏一拍?如果QKV对你来说只是三个字母的堆砌,而不是活生生的机制与逻辑,那么这场“精通”的豪言壮语恐怕要露馅了。这篇文章将带你直
2025-04-12 10:18:07
500
原创 Agent系列教程:什么是Agent?当今为什么这么重要?
理解 AI Agent 的演变、架构和未来Agent(智能体)是一个能够基于数据自主完成任务或做出决策的程序。它与 AI模型对话,以使用工具和资源执行基于目标的操作。传统 AI 模型和 Agent 之间的区别是微妙但意义深远的。当我们与 AI 模型(例如 Gemini、o1、Sonnet 或类似的大型语言模型)交互时,本质上是在进行一系列一次性的互动:我们提供输入,模型处理输入,然后返回输出。虽然这些互动可能很复杂,但它们从根本上来说是被动的、无状态的。每个响应都孤立存在,没有真正的连续性,也无法采取
2025-04-12 10:14:19
760
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人