自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1055)
  • 收藏
  • 关注

原创 新手必看!我如何6步用(Coze)轻松搭建了一个AI智能体

AI智能体就像是一个虚拟的"小助手"。它能听懂你的话,理解你的需求,并帮你完成任务。想象一下,你有了一个24小时待命的私人助理,随时随地为你服务。这就是AI智能体的魅力所在。

2025-01-04 17:19:05 7190

原创 一图了解大模型是什么?附国内外知名大模型及240余家大模型清单!

引申到模型层面,涌现能力指的是当模型的训练数据突破一定规模,模型突然涌现出之前小模型所没有的、意料之外的、能够综合分析和解决更深层次问题的复杂能力和特性,展现出类似人类的思维和智能。简而言之,大模型是指利用海量数据,通过先进的算法和技术,训练得到的具有强大预测和决策能力的模型。它们利用大算力、使用海量的开放数据与具有巨量参数的深度学习算法,在大规模无标注数据上进行训练,以寻找特征并发现规律,进而形成可“举一反三”的强大泛化能力,可在不进行微调或少量微调的情况下完成多场景任务,相当于AI完成了“通识教育”。

2024-12-09 16:00:36 3208

原创 太强了!10大开源大模型!

近期,Meta 隆重推出了两款开源模型:Llama 3 8B与Llama 3 70B,这两款模型可供外部开发者免费使用。Meta 表示,Llama 3 8B和Llama 3 70B在目前同体量模型中,展现出卓越的性能,堪称业界的佼佼者。从Meta 分享的基准测试结果来看,Llama 3 400B+ 的实力不容小觑,其性能已逼近Claude超大杯以及新版GPT-4 Turbo,虽然还存在一定的差距,但足以证明它在顶尖大模型领域已占有一席之地。

2024-11-23 11:20:38 4513

原创 “农业+大模型”的八大应用场景及成功案例

当前处于一个农业生产力提升与城镇化融合发展的一个关键时期,此前受耕作主体分散和生产水平的影响,我们的农业在解决了温饱水平之后,长时期处于碎片化作业与集约化程度不足的状态。随着近年智慧化应用积累和大模型的快速发展,“农业+大模型”的结合发展成为一种新的产业形态,也需要从体制到从业主体各个层面的改革以适应科技生产力的发展。农业与大模型的结合是新质生产力的体现,大模型在农业中的应用正是通过引入先进的人工智能技术,提升农业生产的智能化、精准化水平,从而创造新的价值和效率。丨。

2024-11-07 16:39:52 3114

原创 什么是LLM?看这一篇就够了!

自从2022年12月 ChatGPT 横空面世以来,AI 领域获得了十足的关注和资本,其实AI的概念在早些年也火过一波,本轮 AI 热潮相比于之前的 AI,最大的区别在于:生成式。本文主要介绍大语言模型(Large Language Model,简称LLM)。通过海量文本训练的、能识别人类语言、执行语言类任务、拥有大量参数的模型,称之为大语言模型。

2024-08-20 20:44:43 2990

原创 无需本地部署!免费使用开源大模型API

之前,我给大家分享过几篇关于如何在本地部署开源大模型以及应用场景的文章。比如说,给本地大模型添加知识库、API的调用等等。在这个过程中,有粉丝反馈自己不会部署,或者电脑配置不好,想知道还有没有办法使用这些开源大模型。今天就来分享一个免费且无门槛使用各种主流开源模型及其API的方法,让你不用在本地部署开源模型,也可以在各种第三方应用中调用这些模型,例如翻译插件、Dify的工作流、对话应用等等。这些场景下都可以用这个方法来省钱。我们今天要用的平台名字叫Groq。

2024-07-10 09:53:46 3303 1

原创 AI大模型·白皮书 | 2025年中国AI大模型产业市场前景及投资研究报告

今天分享的报告是《2025年中国AI大模型产业市场前景及投资研究报告》,版权归中商产业研究院所有。AI大模型是指在机器学习和人工智能领域中,具有庞大参数量和复杂结构的模型这些模型通常由大量的神经网络层组成,具有数百万或数十亿的参数,需要大量的计算资源和存储空间进行训练和推理。其中,通用大模型能够综合多种领域的数据和知识,进行全局性的分析和预测;行业大模型则针对于某个行业进行优化和训练,提供更加精准的解决方案。

2025-05-06 14:22:16 243

原创 一文搞懂 AI Agent:从智能体到工作流全解析

AI Agent 就像你的「数字小管家」,而工作流就是它「干活的步骤清单」。简单任务用「单线程」,复杂任务用「并行」,想让它变聪明就用「循环优化」。适合用在「重复性高、步骤多」的场景(规划、客服、数据处理),但复杂或高风险的事(比如签合同、医疗诊断),最好最后检查一遍。现在你可以试试让手机里的智能助手(比如 Siri、小爱同学)做件小事,感受一下 Agent 工作流的魅力啦!

2025-05-06 14:11:56 930

原创 大模型应用落地白皮书:企业AI转型行动指南 (附下载)

大模型应用落地白皮书:企业AI转型行动指南》由火山引擎与IDC联合发布,核心观点围绕大模型技术与企业业务融合展开,旨在为企业AI转型提供指引。大模型加速从探索走向落地:大模型技术推动AI应用升级,企业对其关注度和投资持续增加,积极拓展试点范围。大模型为企业带来多维价值,涵盖员工、用户、营收和市场等方面,提升工作效率、创新用户体验、推动产品服务升级等,坚定了企业探索其潜力的决心。企业落地面临的挑战与机遇:大模型落地面临高成本、模型选配难、部署落地细节复杂、安全风险与可解释性等多重挑战。

2025-05-05 15:48:37 544

原创 一文说清楚什么是预训练(Pre-Training)和微调(Fine-Tuning)

预训练是让AI模型在大规模数据上学习通用知识的过程,类似于学生的“基础教育”。微调是在预训练模型的基础上,针对特定任务进行进一步训练的过程,类似于学生的“专项培训”。预训练和微调的结合,使得AI模型能够从“通才”成长为“专才”,在各种任务中表现出色。

2025-05-05 15:43:25 691

原创 大模型概念、技术与应用实践(140页PPT报告)

在数字化浪潮汹涌澎湃的今天,大模型犹如一颗耀眼的明星,迅速崛起并成为科技领域的璀璨焦点。从最初的理论探索,到如今广泛渗透于各行各业,大模型正以前所未有的速度改变着我们的生活与工作方式。它不仅是人工智能技术的一次重大飞跃,更是驱动经济增长、提升社会治理效率、加速科技创新的关键驱动力。本报告将深入探讨大模型的核心概念、原理特性及其丰富多样的应用实践案例,旨在帮助大家全面认识这一前沿技术,明确其在当前及未来发展中的核心地位与深远影响,并共同探索如何利用大模型的力量推动社会各项事业迈向新高度。

2025-05-04 11:30:00 456

原创 大模型(LLM)蒸馏技术解析:应用、实现等等

LLM 蒸馏是一种旨在。

2025-05-04 09:15:00 1688

原创 终于有人把大模型11种微调方法说清楚了!

前缀调优(PrefixTuning)是一种轻量级的微调替代方法,专门用于自然语言生成任务。前缀调优的灵感来自于语言模型提示,前缀就好像是“虚拟标记”一样,这种方法可在特定任务的上下文中引导模型生成文本。前缀调优的独特之处在于它不改变语言模型的参数,而是通过冻结LM参数,仅优化一系列连续的任务特定向量(即前缀)来实现优化任务,如图1所示。

2025-05-03 10:00:00 47

原创 3分钟搞懂AI大模型高频词:Token、RAG、RL…(附应用场景)

Token是AI处理文本的最小单位,相当于自然语言中的“字词片段”。例如“人工智能”可能被拆分为“人工”+“智能”两个Token,或保留为单个Token(不同模型分词规则不同)。DeepSeek官方也给出Token数和字数的大致换算比例如下:1 个英文字符 ≈ 0.3 个 token。1 个中文字符 ≈ 0.6 个 token。

2025-05-03 09:00:00 1729

原创 必看!AI大模型使用攻略,一文读懂大模型常见的10个核心概念

如今高效智能的AI大模型,正如雨后春笋般破土而出,人们对于AI大模型的学习与探索之路,也愈发宽阔平坦。虽然AI工具已不再陌生,但其中关于AI Prompt、大模型的吞吐量、蒸馏与量化、私有化知识库等这些常见的专业术语,你又了解多少?这篇文章将帮助你快速掌握AI行业常见的核心概念。

2025-05-02 09:00:00 1246

原创 人人都能学会的AI指南:从机器学习到大模型全流程解析(附PDF)

接下来是进阶篇,你将掌握RAG、Agent、Langchain、大模型微调和私有化部署,学习如何构建外挂知识库并和自己的企业相结合,学习如何使用langchain框架提高开发效率和代码质量、学习如何选择合适的基座模型并进行数据集的收集预处理以及具体的模型微调等等。最后呢,会给大家一个小福利,课程视频中的所有素材,有搭建AI开发环境资料包,还有学习计划表,几十上百G素材、电子书和课件等等,只要你能想到的素材,我这里几乎都有。所以我综合了大模型的所有知识点,给大家带来一套。我们这套大模型资料呢,会从。

2025-05-02 07:00:00 319

原创 Qwen3 全面发布:性能、部署与使用指南

Qwen3-32B使用 Hugging Face Transformers 框架,可以快速体验 Qwen3 模型。默认启用思考模式(),可根据需要调整。示例:使用 vLLM 快速部署API 接口地址默认:http://localhost:8000/v1。

2025-05-01 14:30:00 573

原创 LLM大型语言模型脑图 - 开发篇

基于大模型的开发是一个快速发展的领域,涵盖从需求分析到部署优化的完整流程。开发框架如Hugging Face、LangChain等提供了强大的工具支持,而开发方向则覆盖了对话系统、代码辅助、多模态应用等多个领域。未来,随着模型性能提升和计算成本降低,LLM将在更多行业中实现深度应用。

2025-05-01 13:45:00 800

原创 附全文 | 《“机器人+人工智能”工业应用研究报告(2025)》

由中国信通院江苏研究院与苏州市机器人产业协会联合编制的《"机器人+人工智能"工业应用研究报告》正式发布。报告深度解析AI与机器人融合的技术演进路径,揭秘工业场景应用突破方向。

2025-05-01 09:45:00 281

原创 一文入门垂域模型 SFT 微调

你将掌握RAG、Agent、Langchain、大模型微调和私有化部署,学习如何构建外挂知识库并和自己的企业相结合,学习如何使用langchain框架提高开发效率和代码质量、学习如何选择合适的基座模型并进行数据集的收集预处理以及具体的模型微调等等。最后呢,会给大家一个小福利,课程视频中的所有素材,有搭建AI开发环境资料包,还有学习计划表,几十上百G素材、电子书和课件等等,只要你能想到的素材,我这里几乎都有。,在小规模、专业化的数据上进一步优化模型,使其在特定任务和领域表现更好。

2025-04-30 22:28:43 959

原创 信通院:“机器人+人工智能”工业应用研究报告2025 | 附PDF文件免费下载

随着数字经济的蓬勃发展,AI 技术正加速从虚拟空间向实体经济领域拓展,机器人作为 AI 技术的理想载体,凭借其高度的灵活性和强大的适应性,正在迅速发展并广泛应用于各个行业,成为推动产业升级和变革的重要力量。《“机器人+人工智能”工业应用研究报告(2025)》由信通院(江苏)科技创新研究院有限公司牵头编写,深入分析了“机器人+人工智能”在工业领域的应用现状、技术趋势及未来展望。

2025-04-30 13:59:39 871

原创 最新最强开源模型 Qwen3 本地运行方法! Windows+ollama+chatwise

千问在放假前扔出了一个重磅炸弹💣–Qwen3!Qwen3 在能力等能力上可以直接和 Gemini,chatgpt,Grok 最强模型掰手腕。模型支持开关深度思考能力,提供多种尺寸,可以在不同设备上运行,支持 119 种语言,还特别增强了智能体能力,支持 MCP。尤其是全部开源,提供了 0.6B 到235b 的全尺寸模型。非常适合在最小的模型只有523M。40亿参数的模型只有 5.2G,一张8G 的显卡,可以轻松运行。但是它的能力却可以匹敌。这不是了,必须在本地跑一跑了!

2025-04-30 13:45:18 872

原创 【报告分享】2025年AI大模型教育行业白皮书(附下载)

在数字化浪潮的席卷下,教育行业正迎来一场前所未有的变革。2025年,AI大模型的崛起,如同一颗划破夜空的璀璨星辰,照亮了教育的未来。今天,就让我们一起深入探讨这份《2025年AI大模型教育行业白皮书》,看看AI大模型如何重塑教育的每一个角落。教育数字化并非一蹴而就,而是经历了漫长的发展历程。从最初的教育ICT建设,到教育信息化2.0,再到如今的数智教育时代,每一步都凝聚着教育工作者和科技人员的智慧与汗水。这一阶段以计算机和网络基础设施建设为主,推动教育资源的初步电子化。

2025-04-29 14:53:17 572

原创 史上最强大模型Qwen3震撼来袭!直接成为大模型王炸!

Qwen3作为一款开源且性能卓越的混合推理模型,凭借其强大的技术特点和灵活的应用场景,正在引领全球AI技术的新潮流。其低成本、高性能和多语言支持能力,不仅为开发者和企业提供了一个强大的工具,也为全球AI生态的发展注入了新的活力。未来,随着更多优化和应用场景的落地,Qwen3有望在全球AI领域占据更加重要的地位。

2025-04-29 14:51:09 684

原创 2025年私域大模型部署白皮书解读(附下载)

4.1 市场展望• 供给侧:硬件架构革新、模型即服务生态成熟,供给端从“卖硬件”转向“卖解决方案+持续服务”。• 需求侧:从单点实验到全链渗透、数据-模型飞轮效应、从通用能力到领域专属、场景耦合度升级、颠覆性场景孵化。4.2 技术演进• 硬件架构升级:存算一体芯片设计、3D异构集成与先进封装、动态能效管理技术。• 模型能力突破:稀疏化与动态计算架构、量化与蒸馏的极致优化、多模态统一建模。4.3 行业发展。

2025-04-28 15:06:29 548

原创 一文剖析大模型、RAG、Agent、MCP、Function Calling、知识库、向量数据库、知识图谱、AGI 的区别和联系

Function Calling 是一种强大的工具,它为大语言模型提供了与外部工具和服务交互的能力,从而解决了大模型知识更新停滞的问题。然而,它的局限性在于缺乏跨模型的一致性和平台依赖性。尽管如此,Function Calling 仍然是一个重要的技术,尤其是在需要快速实现特定功能时。未来,随着技术的不断发展,我们期待看到更多能够克服这些局限性的解决方案。

2025-04-28 15:00:31 1014

原创 【大模型入门级】Agent 面试八股文,简单背一背

大模型 Agent(LLM Agent)是一种基于大型语言模型(LLM)的智能体,能够自主解析任务、调用工具、执行推理,并与环境交互。

2025-04-27 15:36:50 670

原创 RAGFlow 构建 Text2SQL 智能体:2 小时的实战之旅

经过两个小时的努力,我成功构建了一个 Text2SQL 智能体。这个过程虽然有些挑战,但也让我学到了很多东西。RAGFlow 是一个非常强大的工具,它可以帮助我们快速实现复杂的数据库查询功能。

2025-04-27 15:17:44 547

原创 DeepSeek企业落地应用讲义精华全版:比清华版更全面、更落地(258页 PPT 可编辑)

介绍了DeepSeek企业落地应用讲义精华全版的内容,包括特征价值篇、交互生成篇、智能增强篇、部署开发篇等。文中详细阐述了DeepSeek在企业中的应用,如特征价值、交互生成、智能增强、部署开发等方面的实践。此外,还介绍了DeepSeek的选人标准、组织模式、组织文化等,以及如何使用DeepSeek进行文本生成、行业调研报告撰写、PPT一键生成等。最后,文中还介绍了大模型在垂直领域使用时需要修改或增强的原因,以及检索增强生成RAG和微调Fine-tunning的选择,并详细介绍了微调的种类和相关工具框架。

2025-04-25 22:25:33 284

原创 中山大学-从技术突破到场景落地:大模型发展图谱与DeepSeek创新应用

2025年初,DeepSeek-R1的横空出世引爆全球AI热潮。这场由大模型掀起的变革浪潮,正以前所未有的速度重塑技术边界与产业生态。在这场变革中,如何把握趋势、抢占先机?该材料将以DeepSeek为锚点,解码大模型发展图谱,剖析核心价值与未来方向。

2025-04-25 22:09:34 158

原创 DeepSeek精通和AI办公提效(PPT 可编辑)

全书分为三大模块:DeepSeek基础概念、实操技巧与办公提效场景,结合案例详细解析提示词设计、本地模型部署、会议纪要生成、财务分析等实用技能。无论是产品经理、数据分析师还是普通职场人士,都能从中获得快速解决问题、提升决策质量的AI赋能方案,帮助用户在智能化办公浪潮中抢占先机。是一本专注于AI工具实战应用的权威指南。本报告共计:55页。

2025-04-25 21:40:32 128

原创 《大模型应用:从提示工程到AI智能体》 课程分享(1-10)

本课程的核心目标是系统介绍大模型应用知识,帮助读者掌握提示工程和 AI 智能体设计技术,以发挥大模型在各类任务中的最大效能。通过理论授课、实践案例分析和讨论,学生将获得对大模型和通用人工智能领域的全面了解,培养相关技能和知识,为未来在该领域的研究和应用工作打下坚实基础。文| 通用人工智能与数字经济创新团队西南财经大学。大模型应用:(六)大模型认知框架。大模型应用:(三)大模型提示词。大模型应用:(二)初识大模型。大模型应用:(一)绪论。

2025-04-25 16:50:31 109

原创 三大智能体对比:Dify vs Coze vs FastGPT平台

在生成式AI技术快速迭代的浪潮中,Dify、Coze和FastGPT作为三大智能体开发平台,凭借差异化的技术路径和功能特性,正在重塑企业级AI应用的开发范式。本文从功能实现、技术架构、应用场景等维度展开深度解析,为开发者提供战略级选型参考。

2025-04-25 15:10:53 1275

原创 DeepSeek R1:一文详解GRPO和多阶段训练!

随着DeepSeek R1的发布,人工智能取得了重大飞跃。DeepSeek R1是一个开放模型,在高级推理任务中挑战OpenAI的o1。DeepSeek R1采用一种称为组相对策略优化(GRPO)的创新技术和多阶段训练方法开发,为人工智能模型在数学、编码和一般推理方面设定了新的基准。DeepSeek R1的独特之处在于,它能够以极高的准确性和推理深度解决复杂任务,同时保持精简的训练过程。本文将深入探讨其基本方法、训练流程以及让DeepSeek R1成为人工智能研究中卓越模型的创新之处。

2025-04-25 14:48:20 558

原创 图解 LangChain 园林设计,画到凌晨只为你规划完美景观

LangChain 就像一位经验丰富的园艺大师,帮你设计和打造完美的 AI 应用花园。2. 提示词模板2. 记忆管理2. 多轮设计对话LangChain 是打造 AI 应用的强大工具,可以帮你:掌握了这些组件,就能设计出赏心悦目的 AI 应用了!记住,就像园林设计一样,简约而不简单才是真谛~作为一名从业五年的资深大模型算法工程师,我经常会收到一些评论和私信,我是小白,学习大模型该从哪里入手呢?我自学没有方向怎么办?这个地方我不会啊。如果你也有类似的经历,一定要继续看下去!这些问题啊,也不是

2025-04-24 15:22:34 908

原创 ChatGPT大揭秘!《ChatGPT 应用与教学》免费分享

你是否在社群上看别人玩得出神入化,但自己用起来,却没有想像中那么神。很多公司开始把 ChatGPT 导入到工作流程与产品创新,但你是否连怎么简易串接都不知道怎么做?不用担心。因为我们汇整了一系列的教学,手把手带着你,一步步掌握 ChatGPT 时代应该具备的应用能力。

2025-04-24 15:12:00 432

原创 【入门必看】大模型是什么?大模型综述,看完不走弯路!

是使计算机模拟人类智能行为的科学,包括学习、推理和自我改进。

2025-04-23 15:35:02 613

原创 一文看懂MCP,理论+实践,教你搭建MCP应用

MCP,全称是Model Context Protocol,模型上下文协议,由Claude母公司Anthropic于去年11月正式提出。MCP刚发布的时候不温不火,直到今年Agent大爆发才被广泛关注。而在今年2月,Cursor正式宣布加入MCP功能支持,一举将MCP推到了全体开发人员面前。从本质上来说,MCP是一种技术协议,一种智能体Agent开发过程中共同约定的一种规范。这就好比秦始皇的“书同文、车同轨”,在统一的规范下,大家的协作效率就能大幅提高,最终提升智能体Agent的开发效率。

2025-04-23 15:23:49 2577

原创 一文读遍 LoRA 家族:大语言模型高效训练的“秘密武器“

LoRA 的核心做法是在预训练权重矩阵 W 旁边添加两个较小的可训练矩阵 A 和 B,同时不改变 W 的参数。想象一下,预训练的权重矩阵 W 是一个经验丰富的 “老将”,已经具备了很多通用知识,但在应对特定任务时还不够完美。这时,矩阵 A 和 B 就像是两个灵活的 “小助手”,在不打扰 “老将” 的情况下,通过自身的训练,为模型在特定任务上提供额外助力。

2025-04-22 16:18:44 900

原创 大模型系列:什么是AI Agent,一文搞清AI Agent!

1. 它是「机器人」吗?不完全是!机器人是硬件载体,而AI Agent是「智能内核」。比如Siri没有实体,但能通过手机麦克风感知你的需求,调用算法生成回应——「感知→决策→执行」的闭环,就是Agent的核心逻辑。2. 它和普通软件的区别?普通软件像「听话的执行者」,你输入指令才会动;而Agent是「有目标的主动者」。比如网购推荐系统会主动分析你的浏览记录,预判你可能喜欢的商品,甚至在大促时帮你规划最优凑单策略——自带「目标驱动」属性,是Agent的终极浪漫。3. 它有「自我意识」吗?目前没有!

2025-04-22 15:43:21 1319

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除