自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1083)
  • 收藏
  • 关注

原创 5 分钟用满血 DeepSeek R1 搭建个人 AI 知识库(含本地部署)

看到这里,相信你已经找到最适合自己的 DeepSeek 个人知识库方案了。如果你和大多数人一样,选择使用官方 API ,那就不用再为性能和本地硬件资源发愁;如果你恰好有充足的算力和技术储备,本地部署也是个不错的选择。不过,在整个过程中,我想和你分享的不仅仅是这些技术细节。而是一个中国团队能做出世界级大模型,一个需要 +86 才能注册的大模型。很庆幸,我们能作为中国 AI 技术进步的见证人。当然,暂时的领先不是终点。但 DeepSeek 给我们带来的,是“中国也可以”这份信心。

2025-02-05 16:07:16 8857 2

原创 2024年国内外最新AI大模型汇总(含ChatGPT、Claude、Kimi、文心、天工、讯飞、通义等10大主流AI大模型)

两年前,我和你谈论AI搜索时,你可能觉得我在做梦。但现在,梦想已经成真——信息搜索,知识工作者的新武器正如鲁迅先生所说:“输入的是垃圾,输出的也是垃圾。”在这个信息爆炸的时代,搜索能力成为了衡量知识工作者能力的关键。AI搜索的崛起AI搜索作为AI领域的热门赛道,正吸引着各路英雄豪杰。搜索引擎的两大类别:就像是我们的_私人助理,随时待命_,通过对话就能理解我们的需求,提供精准搜索结果。比如chatgpt、kimi、万知等。:这类搜索引擎则将AI技术融入搜索过程,让搜索结果更个性化、多样化。

2024-09-19 17:26:48 26180

原创 用国产长文本大模型写小说,这个太强悍了 !

GLM-4-Long是智谱 BigModel开放平台(bigmodel.cn)推出的一款先进语言模型,适用于需要大规模文本生成的应用场景。GLM-4-Long有很多的实际应用场景:比如说,解读企业年报、学习论文文献、公司财务报表、阅读长篇小说甚至是分析总结长视频。关键是价格非常亲民,100万 tokens 只需1元 ,这简直是白给了,良心定价!2。

2024-09-16 18:00:00 6480

原创 RAG大模型增强生成能力案例有哪些?

我们经常把大模型比作一个大学生。相当于面试的时候问大学生”你是如何看xx公司的?相当于对已经入职的大学生说“去我们公司的资料库里查查,出一个关于这个公司的调研报告”“查阅资料库”就相当于是RAG,全称是Retrieval Argumented Generation — 检索增强生成。把检索(资料库)的结果发给大模型,以增强大模型的生成能力。说实话RAG入门很容易,我的开发伙伴(公众号AI小智)在带病情况下,大概用了一个周末完成coding。不过要想做好可不容易。

2025-05-05 15:20:28 537

原创 2025年AI大模型教育行业白皮书-32页(附下载)

接下来是进阶篇,你将掌握RAG、Agent、Langchain、大模型微调和私有化部署,学习如何构建外挂知识库并和自己的企业相结合,学习如何使用langchain框架提高开发效率和代码质量、学习如何选择合适的基座模型并进行数据集的收集预处理以及具体的模型微调等等。最后呢,会给大家一个小福利,课程视频中的所有素材,有搭建AI开发环境资料包,还有学习计划表,几十上百G素材、电子书和课件等等,只要你能想到的素材,我这里几乎都有。所以我综合了大模型的所有知识点,给大家带来一套。我们这套大模型资料呢,会从。

2025-05-05 15:04:15 238

原创 【一文说清】大模型:蒸馏、微调、RAG,超级简单!通俗易懂,0基础小白也能看懂!

想象一下,一个知识渊博的大学教授(大模型)和一个天真无邪的小学生(小模型)。教授啥都会,但请他来上课很贵,教室得配超级电脑,电费也高得吓人。小学生虽然啥都不会,但养起来便宜,一台普通笔记本就能跑。怎么办呢?我们让教授把自己的“解题技巧”浓缩一下,教给小学生,虽然不能让小学生变得和教授一样牛,但至少能学会几招,能应付日常问题。这就是模型蒸馏。学习AI大模型是一项系统工程,需要时间和持续的努力。但随着技术的发展和在线资源的丰富,零基础的小白也有很好的机会逐步学习和掌握。给教授一个问题(比如“这是猫还是狗。

2025-05-04 11:00:00 1069

原创 2025央国企AI+数智化转型研究报告

接下来是进阶篇,你将掌握RAG、Agent、Langchain、大模型微调和私有化部署,学习如何构建外挂知识库并和自己的企业相结合,学习如何使用langchain框架提高开发效率和代码质量、学习如何选择合适的基座模型并进行数据集的收集预处理以及具体的模型微调等等。最后呢,会给大家一个小福利,课程视频中的所有素材,有搭建AI开发环境资料包,还有学习计划表,几十上百G素材、电子书和课件等等,只要你能想到的素材,我这里几乎都有。所以我综合了大模型的所有知识点,给大家带来一套。我们这套大模型资料呢,会从。

2025-05-04 10:15:00 188

原创 一文搞懂:RAG、Agent与多模态的行业实践与未来趋势

首先:计划、需求分析、框架设计、系统方案、编码实现、功能性测试,最后是产品交付。接下来是进阶篇,你将掌握RAG、Agent、Langchain、大模型微调和私有化部署,学习如何构建外挂知识库并和自己的企业相结合,学习如何使用langchain框架提高开发效率和代码质量、学习如何选择合适的基座模型并进行数据集的收集预处理以及具体的模型微调等等。最后呢,会给大家一个小福利,课程视频中的所有素材,有搭建AI开发环境资料包,还有学习计划表,几十上百G素材、电子书和课件等等,只要你能想到的素材,我这里几乎都有。

2025-05-03 12:00:00 806

原创 信通院:“机器人+人工智能”工业应用研究报告 2025

报告由中国信通院江苏研究院和苏州市机器人产业协会等单位编写。报告分析了 “机器人 + 人工智能” 在工业领域的应用情况,探讨其发展背景、技术趋势、应用现状,并对未来进行了展望,还列举了苏州市相关应用案例。研究背景:大模型推动机器人向通用化发展,软硬件协同提供算力支持。各国纷纷布局相关产业,中国也出台多项政策促进二者融合。工业领域因环境特点成为智能机器人应用落地的主战场,中国工业机器人市场规模大,但在核心技术方面仍需提升。

2025-05-03 09:45:00 401

原创 【MCP实战】MCP+Agent+通义千问,创建网页总结智能体实战

为什么需要网页总结智能体?

2025-05-02 09:00:00 793

原创 浙江大学:大小模型端云协同赋能人机交互 2025

本文围绕大小模型端云协同赋能人机交互展开,介绍了相关背景、技术、应用及研究成果,具体如下:研究背景:随着 AI 发展,大模型带来变革,英伟达黄仁勋提出 “人工智能的 iPhone 时刻”。移动端设备计算能力增强,但面临算力、带宽和电量限制,云智能也存在推理响应延时高、模型更新周期长等局限,端云协同成为趋势。

2025-05-02 09:00:00 280

原创 美国斯坦福大学《2025年人工智能指数告》解读

斯坦福报告揭示了AI技术快速迭代与全球竞争的复杂图景:性能趋近但生态差距犹存,成本下降推动普惠化,但监管、伦理和基础研究仍是关键挑战。中国在应用和专利上表现突出,但需警惕“应用强、生态弱”的潜在风险;美国则持续领跑创新与投资,开源技术正在重塑行业格局。未来,AI的可持续发展需平衡技术突破、社会信任和全球协作。

2025-05-01 08:15:00 804

原创 RAG是什么?为什么它能让大模型回答更准确?

它不只是简单的问答工具,而是打通了从数据沉淀到业务决策的最后一步。最终,

2025-05-01 07:45:00 696

原创 如何微调你的第一个领域大模型?

微调(Fine-tuning)大模型,就像是给一个已经学富五车的大脑(预训练的基础大模型),

2025-04-30 22:30:41 572

原创 MARFT:大模型多智能体强化微调范式来啦!

该论文详细介绍了 MARFT 的核心实现,强调了其模块化和适应性,并提供了完整的开源代码,以促进采用和进一步研究,具体见如下论文与代码链接。

2025-04-30 22:25:36 626

原创 最强开源大模型?Qwen3 系列深度解析 + 本地部署指南

Qwen3 支持在一个模型中无缝切换“

2025-04-30 13:35:41 710

原创 【综述:入门必读】RAG演变到MRAG的三个阶段

生成方面为了解决上述问题,MRAG2.0 通过文档解析和索引保留多模态数据,同时引入了多模态检索和多模态大语言模型进行答案生成,真正进入了多模态时代。通过利用多模态大语言模型 (MLLM) 的能力,生成模块现在可以直接处理多模态数据,最大限度地减少数据转换过程中的信息丢失。

2025-04-30 11:59:21 561

原创 清华大学:郑纬民教授在全球软件开发大会技术分享,《关于人工智能大模型的几点思考》

郑纬民教授于2025年在QCon全球软件开发大会上发表了题为《关于人工智能大模型的几点思考》的主题报告。在这份报告中,郑教授深入分析了人工智能大模型的技术演进方向、所面临的核心挑战,以及在国内环境下的应用实践。他的分享为业界从学术研究到实际工程应用提供了宝贵的见解与指导。

2025-04-29 14:58:58 354

原创 一文详解阿里最新发布Qwen3,直接王炸!

Qwen3是由阿里云通义团队(Qwen team, Alibaba Cloud)开发的大型语言模型系列。它是继Qwen2.5之后的最新一代模型,汲取了团队在构建QwQ(思维模式)和Qwen2.5的经验。这次发布包含了多种不同规模的模型,并且对模型的权重进行了公开,遵循 Apache 2.0 开源许可协议。这意味着更多开发者和研究人员可以免费使用和研究这些前沿的模型。阿里巴巴发布的Qwen3系列大型语言模型,无论在模型能力、使用灵活性还是开源开放方面,都代表了阿里在****AI领域又一次重大进步。

2025-04-29 14:39:45 1097

原创 杀疯了!Prompt入门神书 《Prompt 学习指南》中文版免费分享

提示工程是随着自然语言处理 (NLP) 和预训练语言模型 (PLMs) 的发展而兴起的新兴领域。通过精心设计的提示 (prompts),可以引导 AI 产生更准确、更有用的结果。提示工程在各个领域都有广泛的应用,例如文本生成、机器翻译、问答系统、对话系统等。目前国内中文版的提示工程权威教程并不多,而今天这份资源是“Prompt 学习指南”就是,指南聚焦于实际应用,提供一系列实用的技巧和案例,帮助用户快速入门并掌握这一新兴技能。这份指南非常贴心的是它将。

2025-04-28 15:14:30 277

原创 多模态大模型是什么?多模态大模型入门看这一篇就好了

笔者第一次接触到understanding这个在AI领域的concept时还是在爱丁堡大学读Master时在NLU+(Natural Language Understanding)的课上,当时Professor Frank Keller在第一课对NLU的定义如下:inputoutput如何让模型去理解输入,从而去处理一些下游的任务。

2025-04-28 14:51:39 648

原创 想入门大模型,一文教你系统的入门大模型?

AI大模型就像给机器装了一个“超级大脑”,它能通过海量数据学习人类语言、图像、逻辑等能力。以ChatGPT、文心一言为代表的大模型,参数规模高达千亿级(相当于人脑神经元的复杂连接),可以写代码、作诗、分析财报,甚至陪你聊天。它的核心优势是通用性——同一个模型能处理翻译、问答、创作等多种任务,不再需要为每个功能单独开发程序,堪称人工智能领域的“瑞士军刀”。

2025-04-27 15:04:34 593

原创 【大模型入门】用大白话讲讲什么是蒸馏,量化,微调?

今天对大模型蒸馏,量化,微调的介绍就到这里啦。蒸馏大师擅长知识传递,量化大师精于压缩体积,微调大师则专注于精细调整。他们各有千秋,适合不同的场景。如果你想要一个轻便的小模型,蒸馏和量化是不错的选择。如果你需要模型在特定任务上表现更好,微调是你的不二之选。当然,你也可以把这三位大师结合起来使用,打造一个既轻便又强大的模型。毕竟,谁不想拥有一个既聪明又灵活的AI助手呢?

2025-04-27 14:42:49 682

原创 2025私域大模型部署白皮书-超云-59页

2025私域大模型部署白皮书-超云-59页

2025-04-25 22:19:36 174

原创 大语言模型(LLM)新手入门指南(英译中)

第1部分定义了LLM,并概述了这些年来使其成为可能的技术和方法的进步。它也处理更实际的话题,例如企业如何发展他们自己的LLM和LLM领域最著名的公司。这应该有助于企业理解采用 LLM如何能够释放前沿的可能性并革新他们的运营。本书的目标是帮助企业理解是什么使LLM与以前的解决方案相比如此具有突破性,以及他们如何从采用或开发它们中受益。第3部分是对想要构建、培训和部署自己的LLM的企业的实用指南。希望这将激励尚未采用或开发自己的物流管理系统的企业尽快这样做,以便获得竞争优势并提供新的 SOTA服务或产品。

2025-04-25 21:45:43 172

原创 2025新一代人工智能技术发展及其应用报告-西藏大学-112页(PPT 可编辑)

中国工程院院士、西藏大学信息科学技术学院教授尼玛扎西,以 “新一代人工智能技术发展及其运用” 为主题,为全校师生带来精彩辅导。讲座中,尼玛扎西院士从 “人工智能”“新一代人工智能”“人工智能 +” 三个维度,全方位展示人工智能魅力,有力论证了其作为社会变革重要驱动力的地位。此次讲座契合西藏大学将数字化建设列为重点,推进教育数字化 “一把手工程” 的规划,对提升师生信息化素养、助力学校治理现代化意义重大。

2025-04-25 17:21:48 143

原创 181页《大型语言模型数据集》全面综述,444个数据集涵盖预训练、指令微调、偏好、评估等,附中英文版

本文着手探讨了大型语言模型(LLM)数据集,这些数据集在LLM的显著进步中扮演了关键角色。这些数据集作为类似根系的基础设施,支持并促进了LLM的发展。因此,对这些数据集的审查成为研究中的一个关键话题。为了解决当前对LLM数据集的全面概述和彻底分析的缺乏,以及获得对它们当前状态和未来趋势的洞见,这篇综述整合并分类了LLM数据集的基本方面,从五个视角出发:(1)预训练语料库;(2)指令微调数据集;(3)偏好数据集;(4)评估数据集;(5)传统自然语言处理(NLP)数据集。

2025-04-25 14:55:02 525

原创 一文看懂Agentic RAG+MCP ,开启智能检索新时代!

RAG工作起来是这样的:用户提个问题,系统就会拿着这个问题去知识库(一般是通过向量数据库里的嵌入技术)找相关信息,找到最匹配的文档后,把这些文档“塞”到模型的提示里,辅助模型给出靠谱的回答。这一招可太妙了,不仅能减少模型“瞎编乱造”的情况,还能在回答里用上特定领域或私人的数据。不过呢,传统RAG也有自己的“小脾气”。它通常只能查询单一数据源,而且就检索一次。要是一开始搜出来的结果不给力,或者用户问题问得有点“奇葩”,那最终答案的质量就很难保证了。

2025-04-25 14:40:34 744

原创 大模型必看系列之《Prompt 学习指南》中文版免费分享

随着最近人工智能的不断进步,提示工程这项技能变得越来越重要。本课程会聚焦于如何使用提示工程。你不需要很多机器学习相关的知识。但如果你完全不知道上面的内容是什么意思,可以在基础部分看到一些介绍。

2025-04-24 15:02:17 411

原创 王炸组合MCP+LangChain,带你轻松创建LLM应用

MCP可与预制工具、智能体协同使用,在大型模型应用中占据重要地位。在实际需求中,大型模型需要与各类数据和工具集成,以拓展功能,MCP恰好能满足这一需求,助力在大型模型基础上搭建复杂工作流程。直接使用大语言模型(LLMs)获取输出并非最佳选择,因其可能产生幻觉,生成错误或无意义的内容。大型模型与工具协同工作时,同样存在幻觉风险。而利用人工智能工具获取正确答案虽可行,但为每个工具编写自定义代码难度较大,操作过程繁琐复杂。大型模型可以与工具协同工作,但这可能会导致产生幻觉。

2025-04-24 14:57:28 823

原创 北大57页 DeepSeek落地应用重磅来袭!(内部版免费下载)

北京大学AI肖睿团队最新发布的《DeepSeek原理与落地应用》,系统拆解了国产大模型从实验室参数竞赛转向产业落地的核心路径。技术架构上,实现“精准节能”——处理数学题仅激活210亿参数,较传统模型降低63%能耗;企业级部署中,基于昇腾910B芯片的方案使70B模型推理成本压至GPT-4的1/3,时延稳定在200ms级。我的DeepSeek部署资料已打包好(自取↓)但如果你想知道这个工具为什么能“听懂人话”、写出代码 甚至预测市场趋势——答案就藏在大模型技术里!❗️为什么你必须了解大模型?

2025-04-23 15:06:37 994

原创 MCP(模型上下文协议)爆火,它究竟是什么?

MCP(Model Context Protocol,模型上下文协议)是一种开放协议,旨在实现大型语言模型(LLM) 应用与外部数据源、工具和服务之间的无缝集成,类似于网络中的 HTTP 协议或邮件中的 SMTP 协议。可以将 MCP 想象成智能体应用程序的 USB-C 接口,它为连接 AI 模型与不同的数据源和工具提供了标准化的方法。

2025-04-23 14:57:39 903

原创 一文讲清楚AI Agent(智能体)

AI Agent(Artificial Intelligence Agent,人工智能代理)是一种能够。

2025-04-22 15:40:37 894

原创 一文看懂混合专家模型 (MoE) 到底是什么?

混合专家(Mixture of Experts,简称 MoE)模型,是一种利用多个不同的子模型(或“专家”)来提升大语言模型(LLM)质量的技术。MoE 架构主要由两个核心组件构成:1.专家模块:每个前馈神经网络(FFNN)层包含一组“专家”,每次可从中选择一个子集。这些“专家”本身通常是 FFNN。2.路由或者网关网络,决定将哪些标记(token)分配给哪些专家。在采用 MoE 架构的大语言模型的每一层中,我们会发现这些专家模块往往具有这样的特点:

2025-04-22 15:29:15 1120

原创 从0-1带你用Ollama+DeepSeek+Docker+RAGFlow搭建个人专属知识库问答系统

通过以上步骤,已经成功在本地搭建了一个基于RAGFlow的智能问答系统。从环境准备到模型配置,再到知识库的创建和问答测试,每一步都至关重要。RAGFlow的强大功能不仅体现在其高效的问答能力上,还体现在其对多种数据格式的支持和灵活的配置选项上。我的DeepSeek部署资料已打包好(自取↓)

2025-04-21 16:05:24 590

原创 RAG检索增强生成技术详解:本地知识库与大模型的结合

在传统大模型生成应用中,模型主要依赖预训练期间学到的知识来回答问题,往往容易出现事实错误或“幻觉”现象。这些错误不仅降低了用户对模型回答的信任度,更在关键领域(如医疗、金融、法律)带来了巨大的风险。为了解决这个问题,RAG(Retrieval Augmented Generation,检索增强生成)技术应运而生。它通过将本地知识库与检索系统整合,把实时、权威的外部信息引入生成过程,从而显著提升答案的准确性、上下文完整性与可追溯性。本文不仅介绍RAG 的基础原理与技术流程,更重点从工程实现与系统优化的角度出发

2025-04-21 15:59:21 1348

原创 一文读懂AI大模型时代的RAG技术

2020年Facebook AI提出RAG(Retrieval-Augmented Generation),通过「检索外部知识+增强模型生成」解决上述问题。核心公式:举一个实际的例子,当我们向 LLM 提出一个问题,RAG 从各种数据源检索相关的信息,并将检索到的信息和问题注入到 LLM 提示中,LLM 最后综合这些信息给出最终答案。

2025-04-18 15:58:15 773

原创 【RAG 实战】用 StarRocks + DeepSeek 构建智能问答与企业知识库

RAG(Retrieval-Augmented Generation,检索增强生成)是一种结合外部知识检索与 AI 生成的技术,弥补了传统大模型知识静态、易编造信息的缺陷,使回答更加准确且基于实时信息。

2025-04-18 15:53:25 999

原创 从AI Agent到Agent工作流,一文详细了解代理工作流(Agentic Workflows)

AI 代理是一种结合了大型语言模型(LLMs)的推理与决策能力,以及现实世界交互工具的系统,使其能够在有限的人类干预下完成复杂任务。代理被赋予特定的角色,并拥有不同程度的自主性来实现最终目标。它们还具备记忆能力,能够从过去的经验中学习,并随着时间的推移提升性能。为了更好地理解AI代理在代理工作流中的作用,需要先了解它们的核心组成部分。

2025-04-17 12:31:52 998

原创 北大DeepSeek-R1权威指南:AI时代必备的大模型实战手册!

继清华大学发布DeepSeek相关教程后,北京大学也推出了更为专业的DeepSeek技术指南。与清华传媒学院版本不同,这份由北大人工智能学院与计算机学院联合编制的教程,在内容深度和专业性上更胜一筹。该教程不仅系统讲解了DeepSeek-R1模型的原理和大模型技术,还深入探讨了AIGC工具的实际应用,特别针对AI时代下的技能需求变化提供了前瞻性分析。

2025-04-17 12:08:27 423

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除