- 博客(106)
- 收藏
- 关注
翻译 先进人工智能将如何影响中国经济前景
我们的研究人员最初预测,中国将获得与其他先进新兴市场经济体类似的AI红利,这意味着到2030年,人工智能的采用率仅为10%至20%,并在2030年代中后期达到顶峰。高盛研究部门目前预计,生成式人工智能将在2026年开始提升中国的潜在经济增长,到2030年将对中国GDP带来0.2至0.3个百分点的提振,高于此前预计的0.1个百分点。这一数字明显低于对美国15%提升的预期。尽管中国的人工智能采用速度可能快于预期,高盛的经济学家认为,这种影响可能更偏向“前期释放”,总体效果可能略低于此前的预测。
2025-05-06 18:52:32
25
翻译 生成式 AI 的重启:将潜力转化为价值的再布线之路
作者:Eric Lamarre, Alex Singla, Alexander Sukharevsky, Rodney Zemmel原文地址:https://www.mckinsey.com/capabilities/mckinsey-digital/our-insights/a-generative-ai-reset-rewiring-to-turn-potential-into-value-in-2024#/是时候对生成式 AI(gen AI)进行一次重启了。
2025-05-05 19:41:43
38
原创 Prompt实战之构建语义搜索引擎 5)构建向量数据库与检索器
Retriever是向量数据库的封装,LangChain 使用它来做“语义搜索”。
2025-04-30 18:41:42
961
原创 Prompt实战之构建语义搜索引擎 4)向量化与 Embedding
嵌入是将自然语言表示为稠密向量(如 1536 维浮点数向量)的过程,使得相似含义的句子具有相近的向量表示。例如,“今天天气真好”和“The weather is great today.” 会被编码为接近的向量。这样可以通过“计算向量距离”来判断语义相似度。📌 向量化让机器能够“理解”文本之间的语义关系。
2025-04-30 18:40:35
532
原创 Prompt实战之构建语义搜索引擎 3)文本切分(Text Splitting)
可以继承自定义规则,例如按段落或特定格式(如 Markdown)分段。
2025-04-30 18:39:44
713
原创 Prompt实战之构建语义搜索引擎 2)文档与加载器(Document & Loader)
在构建语义搜索系统的第一步,我们需要将原始文档导入程序中进行处理。LangChain 提供了丰富的**文档加载器(Loaders)**来从各种数据源中读取文本内容。本章将聚焦如何使用 LangChain 加载本地 PDF 文件,并将其转化为后续可处理的文档格式。如果你加载的是扫描版 PDF 或图片 PDF,请使用 OCR 加载器(如。加载 PDF 文件,它是 LangChain 提供的社区加载器之一。后续所有处理(如文本切分、嵌入生成)都会基于。)或 PDF-OCR 工具(如。LangChain 中的。
2025-04-30 18:38:40
723
原创 Prompt实战之构建语义搜索引擎 1)介绍
语义搜索(Semantic Search)正逐渐成为现代信息检索系统的核心能力,尤其在结合大语言模型(LLM)的应用中扮演着至关重要的角色。本教程将通过构建一个基于 LangChain 的语义搜索引擎,带你逐步掌握实现检索增强生成(Retrieval-Augmented Generation, RAG)系统的关键技能。LangChain是一个专为构建大语言模型应用设计的框架。文档加载与预处理;文本分块;向量化与存储;数据检索;与语言模型的无缝集成。
2025-04-30 18:38:03
1001
原创 工业/服务机器人与具身智能的前景分析
具身智能(Embodied Intelligence)强调智能体通过与物理环境的实时交互来学习和决策,是机器人技术的重要发展方向。在工业机器人和服务机器人领域,具身智能的应用前景差异显著,但均具有颠覆性潜力。具身智能正推动机器人从“自动化工具”向“自主智能体”进化,其应用前景取决于技术、成本与伦理的协同突破。
2025-04-28 20:48:12
576
原创 大语言模型(LLM)行业的波特五力分析
大语言模型(Large Language Models, LLMs)是当前人工智能领域的核心赛道,其行业竞争格局受技术、资本、政策和生态多重因素影响。:⭐️⭐️⭐️(替代威胁存在,但LLM的泛化能力仍具优势):⭐️⭐️(新进入者威胁较低,但巨头跨界竞争需警惕):⭐️⭐️⭐️⭐️(竞争激烈,但市场远未饱和):⭐️⭐️⭐️⭐️⭐️(供应商议价能力极强):⭐️⭐️⭐️(购买者议价能力中等)
2025-04-28 20:40:40
775
原创 # Prompt实战之多文档总结 4)Refine 策略打造高精度总结 ##
在一些场景中,我们需要尽可能详细、准确医疗记录总结法律文档整合科研资料梳理这时候,仅仅 Map-Reduce 可能不够细致。Refine 策略。Refine 策略通过初步总结➔逐步增量完善的方式,逐步构建出高质量总结。先用第一份文档生成一个初步总结;后续每一份文档,读取之前已有总结,并结合新文档内容,逐步改进总结;最终形成一个包含全部信息的完善总结。▶️提示Refine 策略是迭代式的,适合高要求总结,但耗时略长。
2025-04-26 18:50:34
615
原创 Prompt实战之多文档总结 3)Map-Reduce 策略高效总结大规模文档
当文档数量变多、单份内容变长时,Stuff 策略就会遇到上下文超长、成本飙升等问题。这一章我们将学习Map-Reduce 策略,一种经典的分步总结法,专门应对大规模、多内容场景。Map-Reduce 策略Map 阶段:每份文档单独总结出一个“小总结”;Reduce 阶段:将所有小总结再次整合、归纳为最终总结。这种方法灵感来自分布式计算中的 MapReduce 思想,可以有效降低单次调用的上下文量,提高扩展性。
2025-04-26 18:49:33
738
原创 Prompt实战之多文档总结 2)Stuff 策略总结多文档
在本章中,我们将实践Stuff 策略。这是最简单的一种多文档总结方法:直接将所有文档堆叠(stuff)在一起,统一发送给 LLM,请求生成总结。虽然简单,但 Stuff 策略在小规模、多数文档内容较短的场景中,依然非常有效。Stuff(堆叠)策略将所有需要处理的文档一次性拼接成一条超大文本;作为一个整体传递给 LLM;由 LLM 直接输出总结内容。
2025-04-26 18:48:40
900
原创 Prompt实战之多文档总结 1)总览
在当今信息爆炸的时代,如何高效地从大量文档(如 PDF、Notion 页面、客户提问等)中提取关键信息成为一项核心挑战。大型语言模型(LLMs)以其卓越的文本理解与综合能力,为这一任务提供了强大的支持。在检索增强生成(Retrieval-Augmented Generation, 简称 RAG)体系中,文档总结不仅可以压缩大量检索到的资料,还能为 LLM 提供更简洁、精准的上下文,从而提升回答质量和效率。本书将带领你通过实际操作,掌握如何使用 LLM 来高效地总结多份文档内容。
2025-04-26 18:47:56
774
原创 Prompt实战之SQL问答系统4) 项目扩展方向
📌 可通过多智能体结构,设置一个“审批 Agent”作为代理人,判断是否交由人工。支持同时访问多个数据库,甚至是非结构化数据(如 CSV、Excel、API)。引入上下文保持机制,支持“连续追问”和“上下文相关的问题”。将智能体行为与用户权限绑定,仅允许查询自身可访问的数据。构建模块化智能体系统,支持异步或并行协作。在高风险请求触发时,暂停执行,转交人工审核。利用上下文(这些人)
2025-04-25 16:39:38
728
原创 Prompt实战之SQL问答系统3)从链到智能体 —— 构建 SQL Agent
假设你有一个 query_database 函数description="用于执行 SQL 查询,并返回结果"通过 ZERO_SHOT_REACT_DESCRIPTION 类型的 Agent,系统会自动推理是否需要使用工具。Thought: 我需要从数据库查询信息Observation: 返回了5条记录...Final Answer: 员工列表如下:...# Agent 1: SQL 生成器。
2025-04-25 16:39:04
889
原创 Prompt实战之SQL问答系统 2)引入人类审查流程(Human-in-the-Loop)
我们可以暂时用控制台输入模拟人类行为。后续也可以替换为 Web 审批、Slack 通知等更复杂系统。我们将在“生成 SQL 语句”与“执行查询”之间插入人工审查步骤。在第一章中,我们成功构建了一个完整的 SQL 问答系统。因此,在系统进入生产环境之前,我们应在关键步骤加入。表时,系统会中断流程并进入人工审批节点。LangGraph 支持流程中的。
2025-04-25 16:37:45
372
原创 Prompt实战之SQL问答系统1)项目介绍
在本章中,我们将从零开始构建一个可以使用自然语言查询数据库的应用。你将学会如何使用LangChain + LangGraph + OpenAI 大语言模型将用户问题转换为 SQL 查询;执行 SQL 查询并获取结果;将查询结果转换成用户可理解的回答。本项目采用 SQLite 格式的Chinook数据库作为示例数据源。
2025-04-25 16:37:07
2029
原创 Prompt工程论文:通过基于事实的归因与拒答学习,衡量并提升大语言模型在检索增强生成(RAG)中的可信度
论文地址:https://openreview.net/pdf?摘要:大语言模型(LLMs)是检索增强生成(RAG)系统的重要组成部分。虽然许多研究聚焦于评估端到端 RAG 系统的整体质量,但对于 LLM 在 RAG 任务中的适用性仍存在理解上的空白。为此,我们提出了,一个全面的度量标准,用于评估 LLM 在 RAG 框架中的可信度。我们的研究结果显示,诸如上下文学习等各种提示方法,并未有效地使 LLM 适应 RAG 任务,且其表现未能在 TRUST-SCORE 上取得良好结果。因此,我们提出了。
2025-04-23 20:09:56
745
原创 Prompt工程论文:REGENESIS-大语言模型可通过自我提升成长为通用推理专家
论文地址:https://openreview.net/pdf?摘要:通过引入显式推理轨迹对大语言模型(LLMs)进行后训练,可以增强其推理能力。然而,获取高质量的推理轨迹数据通常依赖于人类或更强大模型的精细监督,这不仅成本高昂,且可能受到授权限制。本文探索了在不依赖任何额外监督的情况下,LLM 能否通过自我合成推理路径作为训练数据来提升其推理能力。现有的自我合成方法(如 STaR)在处理域外(OOD)推理任务时存在泛化能力差的问题。
2025-04-23 18:12:20
666
原创 Prompt工程论文:在推理任务中,相较于扩展参数规模,优化大语言模型推理时的计算资源调度可能更加高效
论文地址:https://openreview.net/pdf?摘要:使大语言模型(LLMs)在推理阶段通过使用更多计算资源来自主优化输出,是构建能够处理开放式自然语言任务的自我改进型智能体的关键一步。本文聚焦于在推理阶段扩展计算资源,并探讨一个核心问题:若LLM在推理时被允许使用固定但非微不足道的计算资源,它在面对具有挑战性的提示时,能将性能提升到什么程度?这一问题的答案不仅影响模型的性能,还对未来的预训练策略及推理与预训练计算资源之间的权衡具有重要意义。
2025-04-23 18:01:33
613
原创 Prompt工程论文:从探索到精通-通过自驱交互使大语言模型掌握工具
论文地址:https://openreview.net/pdf?摘要:工具学习使大语言模型(LLMs)能够通过调用工具与外部环境进行交互,这是一种有效的策略,用以缓解其预训练数据所固有的局限性。在这一过程中,工具文档发挥着关键作用,它为LLMs提供使用说明,从而促进工具的有效使用。本文聚焦于一个关键挑战:由于现有以人为中心的工具文档存在不足与不准确性,LLMs与外部工具之间存在理解鸿沟。
2025-04-23 17:48:56
759
原创 Prompt工程之LangGraph 9)部署与集成
常见的 Web 框架,如 FastAPI 和 Streamlit,都是非常适合与 LangGraph 结合的工具。此时,我们可以设置一个专门的“进度状态”字段,传递给前端,以便用户能够实时看到执行进度。现在,FastAPI API 就已经搭建完成,可以通过 POST 请求调用 LangGraph 工作流,传入相应的输入数据。通常,前端发送的数据格式是 JSON 格式,包含工作流所需的输入信息。此时,用户可以通过 Web 界面输入数字并执行 LangGraph 工作流,结果将在页面上显示。
2025-04-21 14:29:45
437
原创 Prompt工程之LangGraph 8):LangGraph 的可视化与调试
在实际项目中,良好的日志记录能帮助你快速定位问题。LangGraph 与 Python 的标准日志库兼容,因此你可以轻松记录节点执行的日志。这个方法生成一个图形化的节点及连接,可帮助你在调试或设计阶段快速验证工作流逻辑。LangGraph 的节点可以返回状态信息,借此你可以追踪每次执行时的状态变化,帮助理解流程中数据是如何流动的。对于一个完整的 LangGraph 工作流,端到端测试确保整个流程的逻辑与状态流畅。模拟输入并检查最终结果。在处理复杂项目时,LangGraph 的调试可能会变得更加困难。
2025-04-21 14:28:28
424
原创 Prompt工程之LangGraph 7)LangGraph 应用实践
💡 小贴士:多个子图可独立构建,如“合同审核子图”“法规查阅子图”,便于后续组合使用。💡 小贴士:将反思意见与输出内容都保存到状态中,便于分析与迭代。LangGraph 不只是控制流程的工具,更是构建“📌 可通过中断恢复机制,实现异步审批挂起与唤醒。LangGraph 天然适合构建具有。LangGraph 特别适合处理。
2025-04-21 14:27:42
402
原创 Prompt工程之LangGraph 6):LangGraph + LangChain Agents
搜索 Agentsearch_tools = [Tool(name="WebSearch", func=fake_search, description="搜索网页")]# 解题 Agentsolver_tools = [Tool(name="Calculator", func=lambda x: eval(x), description="数学工具")]# 总结 Agent。
2025-04-21 14:26:55
250
原创 Prompt工程之LangGraph 5)LangGraph 的高级能力
在 LangGraph 中,add_conditional_edges。LangGraph 支持将一个图嵌套为另一个图的节点,实现模块化设计。💡 小贴士:条件跳转逻辑推荐保持简单清晰,复杂逻辑可封装到单独函数。📌 示例场景:构建一个“摘要模块”或“搜索工具模块”作为独立子图。LangGraph 图可中断保存状态、稍后恢复执行。架构,再加入评分与阈值判断逻辑。计数器来避免无限循环。📌 你可以参考第3章的。
2025-04-21 14:26:16
311
原创 Prompt工程之LangGraph 2)LangGraph 的核心概念
")💡LangGraph 中节点函数通常接收并返回一个「状态」对象。2.3 边(Edge):控制流程走向的桥梁边用于指定哪个节点在完成后应跳转到下一个节点。固定跳转:从 A → B条件跳转:根据状态判断 A → B 或 A → C节点函数始终接收并返回状态;条件边可以让图变得「聪明」;状态是你设计智能体行为的「记忆存储器」;每个图结构都应明确入口与终点。
2025-04-21 14:24:07
414
原创 Prompt工程论文:ExpeL- 大语言模型智能体是体验式学习者
论文地址:https://ojs.aaai.org/index.php/AAAI/article/download/29936/31635摘要:近期,关于将大型语言模型(LLMs)应用于决策任务的研究兴趣激增,并通过利用LLMs中蕴含的广泛世界知识取得了显著进展。尽管人们对定制LLMs以适应特定决策任务的需求日益增长,但对其进行微调不仅资源消耗巨大,还可能削弱模型的泛化能力。此外,最先进的语言模型如GPT-4和Claude主要通过API调用访问,其参数权重仍为专有,公众无法获取。
2025-04-20 20:48:45
979
原创 Prompt工程论文:AdaPlanner-基于反馈与语言模型的自适应规划
论文地址:https://arxiv.org/pdf/2305.16653摘要:大型语言模型(LLMs)近期在作为自主代理执行顺序决策任务方面展现出巨大潜力。然而,目前多数方法要么在没有规划的情况下贪婪地采取行动,要么依赖于无法根据环境反馈进行调整的静态计划。因此,随着问题复杂度和计划跨度的增加,LLM 代理的顺序决策性能会逐渐下降。我们提出了一种闭环方法——,使 LLM 代理能够根据环境反馈自适应地优化其自生成的计划。在 AdaPlanner 中,LLM 代理结合与。
2025-04-20 20:38:25
559
原创 Prompt工程论文:AutoManual-通过交互式环境学习,由大语言模型代理构建使用手册
论文地址:https://arxiv.org/abs/2405.16247摘要:大型语言模型(LLM)驱动的智能体在机器人、游戏、网页导航等多个领域中展现出自主完成任务的潜力。然而,这些智能体通常需要精心设计和专家级提示才能在特定领域内解决任务,这限制了它们的适应能力。我们提出框架,使 LLM 智能体能够通过交互自主构建理解,并适应新环境。为减少规则管理中的幻觉现象(hallucination),我们为 Builder 引入了一种。最后,智能体将这些规则整理为一份完整的使用手册。
2025-04-20 20:24:49
667
原创 Prompt之多智能体评分系统实战 5)构建完整的多智能体工作流
例如,可以让用户在第一次查询后,继续提供更多的餐厅信息,或者查询同一餐厅的不同方面(如菜品、服务等)。函数是整个多智能体工作流的核心,它负责初始化代理、设置聊天序列、注册函数并启动整个流程。通过统一配置,我们确保所有智能体都使用相同的模型和API接口,避免配置不一致导致的错误。在构建多智能体系统时,每个智能体需要统一的配置,以确保它们能够协同工作。用于将函数与智能体进行注册,以便智能体能够调用这些函数执行任务。: 在每个智能体执行时,输出详细的日志信息,帮助追踪进程。)逐步检查每个函数和智能体的执行流程。
2025-04-19 20:01:03
642
原创 Prompt之多智能体评分系统实战 4)计算综合评分与评分智能体设计
请为一个评分代理构造一个简洁明了的英文提示词,使其能正确计算并返回评分结果。但这些只是离散的单项得分,我们需要将其合并为一个。入口代理将分析结果传递给评分代理,后者完成调用。使用几何均值公式,计算综合评分(保留三位小数)本系统使用的是一种结合食品与服务评分的。,方便用户快速理解一家餐厅的整体表现。,最终结果为浮点数,保留三位小数。,并返回整洁的结果。
2025-04-19 19:59:47
470
原创 Prompt之多智能体评分系统实战 3)基于关键词的评论评分分析
字典,使其能覆盖更多真实评论用语(如:“meh”, “nice”, “slow”, “friendly” 等)第4章:计算综合评分与评分智能体设计。这类文本对于机器而言是非结构化的,难以直接参与评分。⚠️提示词要求“每条评论必须提取两个关键词”:一个对应食品质量,一个对应服务质量。你可以根据任务领域扩展此字典,例如加入 “meh”、“nice” 等词汇。确保消息格式匹配,提示词一致,才能让大语言模型准确响应。,将用户评论中的关键词与评分等级建立对应关系。
2025-04-19 19:57:14
721
原创 Prompt之多智能体评分系统实战 2)评论数据的提取与预处理
改造为可以模糊匹配(例如支持“熊猫快餐”也能找到 “Panda Express”)✅预期结果:打印出所有包含 “Panda Express” 的评论列表。这一部分为整个流程提供了“燃料”——原始评论数据,打好坚实的基础。⛔错误结果:空字典或报错,需检查文件路径、餐厅名称是否规范化。:不同变体的输入都可匹配到相同的评论内容。这样便于后续传递给下一个智能体进行分析。并返回出现过的所有餐厅名称。为避免匹配失败,我们使用。评论数据保存在本地文件。:请尝试编写一个新函数。
2025-04-19 19:56:14
694
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人