- 博客(594)
- 资源 (17)
- 收藏
- 关注
原创 LangGraph范式-Plan-and-Execute
Plan-and-Execute范式是一种多步骤任务处理框架,其核心思想是先制定详细计划,再逐步执行,并在必要时进行动态调整。该范式受到BabyAGI项目和Plan-and-Solve论文的启发,强调长期规划,适合复杂任务。与ReAct范式(边思考边行动)不同,Plan-and-Execute通过明确的步骤分解和执行,避免了局部最优或循环问题。其主要步骤包括:规划(使用LLM生成多步骤计划)、执行(逐项完成任务并记录结果)、重新规划(根据执行结果调整计划)。该范式适合需要多阶段推理的任务,但依赖LLM的性能
2025-05-14 10:55:10
542
原创 LangGraph范式-LLMCompiler
LLMCompiler是一种代理架构,旨在通过有向无环图(DAG)中的即时执行任务来加速代理任务的执行,并减少对大型语言模型(LLM)的调用次数以节省成本。它包含三个主要组件:规划器(Planner)、任务获取单元(PlanandSchedule)和连接器(Joiner)。LLMCompiler借鉴了编译器的设计理念,将用户的高级指令分解为一系列低级操作,并通过图结构动态执行这些操作。它特别适用于需要任务规划、动态调度和多步骤执行的场景,如自动化工作流、复杂查询处理或多工具协作。LLMCompiler的核心
2025-05-14 10:51:35
303
原创 LangGraph范式-LATS
LATS(LLMAgentTreeSearch)是一种结合大型语言模型(LLM)和树搜索(TreeSearch)的AIAgent开发范式,旨在解决需要复杂推理和探索的问题。LATS通过将LLM的生成能力与树搜索的系统性探索相结合,模拟人类在决策过程中的试错和优化行为。它特别适用于多步推理、假设验证或优化任务,如数学推理、规划任务或代码调试。LATS体现了现代AIAgent开发的趋势,
2025-05-13 10:35:05
830
原创 LangGraph范式-retries
在LangGraph中,重试机制(Retries)是提高工作流可靠性和鲁棒性的关键,尤其在处理不可靠的外部依赖(如LLM、API、工具)或动态用户交互时。该机制通过自动或有条件地重新尝试执行失败的节点,确保工作流的顺利进行。核心流程包括初始提取、结果验证、错误修正、重试循环和最终输出。重试策略支持固定重试次数、指数退避、错误
2025-05-13 10:32:22
612
原创 LangGraph范式-langgraph_code_assistant
langgraph_code_assistant 是一个多功能的代码助手代理,旨在通过多轮交互、工具调用和状态管理,帮助用户生成、调试、优化和解释代码。它能够处理复杂的编程任务,如编写Python脚本、调试错误、生成测试用例和解释代码逻辑。该助手通过动态调整交互流程,基于用户输入或代码执行结果决定下一步操作,并集成外部工具(如
2025-05-09 17:27:23
814
原创 LangGraph范式-information-gather-prompting
Information-GatheringPrompting是LangGraph中通过提示工程(Prompt Engineering)设计的工作流,旨在系统性地从用户或外部数据源收集信息。该方法适用于多轮交互任务,如客户信息收集、问卷调查、诊断对话或任务分解。LangGraph的图结构特别适合此类任务,其主要特征包括动态调整提示以收集缺失信息、根据用户输入路由到不同节点(如澄清问题、验证数据),以及保持交互状态以确保对话连贯性和信息完整性。提示工程的核心在于提示设计,关键策略包括动态提示、上下文保持、用户友
2025-05-09 17:22:02
835
原创 LangGraph范式-Chat Bot Evaluation as Multi-agent Simulation
ChatBotEvaluationasMulti-agentSimulation是一种通过LangGraph模拟用户与聊天机器人交互的自动化评估方法,旨在提升测试效率并解决传统手动测试的耗时和复现难题。该方法通过模拟用户(SimulatedUser)与聊天机器人(ChatBot)之间的多代理交互,测试机器人在不同场景下的表现,尤其适用于客户支持机器人等复杂对话场景。核心组件包括: SimulatedUserNode:基于LLM(如ChatOpenAI)生成用户输入,模拟真实用户行为(如航空客户
2025-05-09 17:18:31
925
原创 LangGraph范式-RAG-Agentic_RAG
当我们想要决定是否从索引中检索时,检索代理很有用。为了实现检索代理,我们只需授予 LLM 访问检索工具的权限。该范式的特点:支持动态决策,例如是否调用检索工具、是否重写查询、是否生成最终答案。
2025-04-25 15:19:37
796
原创 LangGraph范式-RAG-Adaptive RAG
Adaptive RAG 是一种 RAG 策略,它将 (1) 查询分析与 (2) 主动/自我纠正 RAG 结合在一起。通过动态调整检索和生成策略来优化答案质量。参考论文:https://arxiv.org/abs/2403.14403安装依赖。
2025-04-25 15:17:35
892
原创 LangGraph之RAG范式-Corrective RAG使用LocalLLM
LLM和 CRAG大致相同,唯一的不同点在于特别使用了本地 LLM(如 Llama3 或 Mistral)和本地嵌入模型(如 Nomic 嵌入),适合离线或隐私敏感场景。
2025-04-22 11:11:21
974
原创 LangGraph之RAG范式-Corrective RAG
是一种改进的 RAG 技术,旨在解决传统 RAG 的局限性。传统 RAG 通过从外部知识库检索相关文档来增强语言模型的生成能力,但如果检索到的文档不准确或不相关,可能会导致生成的内容出现误导或错误。CRAG 通过引入。
2025-04-22 09:47:43
1092
原创 目前主流的AI Agent开发框架对比和分析
初学者或小团队Coze是最佳选择,低门槛且快速上线,适合简单任务;FastGPT适合国内预算有限的知识库场景。企业级复杂应用Dify提供开源灵活性和 RAG 能力,适合私有化需求;LangChain和AutoGen适合技术团队开发多代理或动态任务系统。云原生与多模态Google ADK是生产级部署的首选,尤其适合 Google 生态用户,但成本较高。预算与本地化FastGPT和Dify的国内支持和低成本优势明显,适合本地化场景。选择框架时,需权衡团队技术能力、预算、部署需求和场景复杂度。
2025-04-15 13:57:31
792
原创 24天学会ComfyUI-1 初探新ComfyUI
官方地址:它很重要很重要.帮助我们自动更新ComfyUI , 自动安装缺失的节点等等.Git获取下来之后,把这个目录放在该目录下ComfyUI Manager作为一个自定义的节点存在.使用的时候,ComfyUI的主界面上点击开即可,如下图3 开始第一个工作流吧.下载这个大模型放到ComfyUI的该目录下 ComfyUI_windows_portableComfyUImodelscheckpoints。
2025-04-15 13:51:02
892
原创 Stable Diffusion中错误Resulting grid would be too large
在StableDiffusion中用Script中的XYZ功能测试大批量生成的图片时,出现这个错误。看字面意思是最终的Grid太大了。超过了配置中的200MPixels。其实我只需要测试3种Sampler即可。这样X和Y的综合少了很多。这个配置在SD的config.json文件中。或者,减去一些Sampler的选择项目。Y 我选中了很多Sampler。可以自行修改大一些,问题解决。结果运行生成出现这个问题。X 我选择了全部的模型。
2025-03-27 10:00:39
288
原创 3-1 关键词反推
上一章,我们介绍了文生图的大部分基本内容本章,我们介绍如何图生图的相关基础知识和关键字反推技巧当我们用AIGC的方式生成图片后,很多时候需要知道某张效果很好的图片当时生成的参数设置是怎么样的。或者有时候需要针对某个品质很好的照片,大量衍生类似的内容。此时我们需要用到反推的能力,包括采样器,CFG配置等等各种内容。那么关键字的反推,就使用了CLIP功能。当然陆续还有更多的数据,参数反推,推荐工具。陆续都会在插件体系中增强和展开。但无论如何RA/SD内置的这个CLIP功能应该是最短小精悍的成手工具了。
2025-03-27 09:54:50
773
原创 Stable Diffusion中如何用GPU而不是CPU,加速出图
no-half 启动不是Half的能力,所谓的Half就是浮点数的一半。但是经常遇到的问题是,启动SD,就有时候出现。–skip-torch-cuda-test 启动环节跳过CUDA检测,这样你就看不到错误了。除非你没有硬件的Nvidia系列的显卡,否则上GPU肯定是必须的。另外如果你用CUDA11.6,对应的torch只能是1.13.0这种了。对应的torch版本对应了cuda和python的版本。cu的意思是CUDA, cp的意思是python。我的解释相对比较通俗,需要更专业术语的,自行找。
2025-03-26 15:15:13
693
原创 AI陪我做事 - 3 Llama.cpp核心开发和掌握
Llama.cpp 是一个开源软件库,专注于在各种硬件上执行大型语言模型(LLM)的推理,特别是在 CPU 上运行。它由 Georgi Gerganov 开发,于 2023 年 3 月开始,旨在提供无依赖的纯 C/C++ 实现,特别优化了 Apple Silicon(通过 ARM NEON、Accelerate 和 Metal 框架)和 x86 架构(支持 AVX、AVX2、AVX512 和 AMX)。它与 GGML 项目共同开发,GGML 是一个通用的张量库,专注于严格的内存管理和多线程。
2025-03-26 00:00:00
1598
原创 AI教你做视频-4 如何从局域网访问ComfyUI
步骤描述1. 找到运行脚本定位 run_nvidia_gpu.bat 文件2. 编辑脚本添加 –listen 0.0.0.0 到命令末尾3. 保存并运行重新运行脚本,服务器监听所有接口4. 访问方式其他机器输入 http://<目标IP>:8188 访问5. 检查 IP 地址使用 ipconfig 命令查看目标机器的 IPv4 地址6. 安全注意确保网络可信,必要时配置防火墙允许端口 8188。
2025-03-25 17:45:26
898
原创 字形绘梦之绘星 – AI数字伴侣开启
【字形绘梦】是一款专注于角色创造的AIGC微信小程序,其中的【绘星】系统是一个核心功能,允许用户设计独特的角色并为其赋予个性。最近,【绘星】系统新增了MBTI性格测试功能,这一更新旨在将流行心理学与创意表达结合,特别针对年轻用户的兴趣和需求。这些类型在社交媒体和年轻人群体中非常流行,经常被用于自我探索和人际关系分析。
2025-03-25 17:42:17
1152
原创 AI教我做事之AIAgent开发-4 LLM三角原则在AI智能体开发中的应用
在AI智能体相关开发领域,LLM三角原则是一个重要的概念,旨在指导开发者构建基于大型语言模型(LLMs)的可靠应用。包括其定义、组成部分、理论背景以及与AI智能体开发的关联。
2025-03-24 10:39:31
776
原创 AI教我做事之RAG开发-25 如何調用 NV-Embed-v2
NV-Embed-v2 是由 NVIDIA 開發的一個通用嵌入模型,於 2024 年 8 月 30 日在 Massive Text Embedding Benchmark (MTEB) 上排名第一,得分為 72.31,涵蓋 56 個文本嵌入任務。它特別在檢索子類別中表現出色,得分為 62.65,涵蓋 15 個任務,這對檢索增強生成(RAG)技術的發展至關重要。該模型基於 Mistral-7B-v0.1,採用解碼器-only 大語言模型(LLM),並引入了潛在注意力層和兩階段指令調優方法以提升性能。
2025-03-24 10:16:54
420
原创 AI教我做事之RAG开发-24 RAG研发中嵌入模型的研究和分析
在 AI 开发的 RAG(检索增强生成)领域,嵌入模型的选择对系统性能至关重要。嵌入模型负责将文本转换为向量,用于检索相关文档以增强生成模型的回答质量。本报告基于 2025 年 3 月 16 日的最新信息,分析并对比 MTEB 排行榜上的顶尖嵌入模型,重点关注其在检索任务中的表现,适合 RAG 开发的场景。
2025-03-24 10:14:49
1037
原创 AI陪我做事 - 2 提示词工程技巧
提示工程无疑是开发 LLM 原生应用程序最关键的技能,因为制作正确的提示可以显著影响应用程序的性能和可靠性。本文根据LLM 三角原则,介绍了八个实用的提示工程技巧,以提高您的 LLM 提示水平。“LLM-Native 应用程序 10% 是复杂模型,90% 是实验数据驱动的工程工作。在本文中,我们将使用“登陆页面生成器”示例来演示如何应用每个技巧来增强现实世界的 LLM 应用程序。首先定义每个代理或提示的目标。每个代理坚持一种认知过程类型,例如:概念化登录页面、选择组件或为特定部分生成内容。
2025-03-21 16:42:35
946
原创 AI教你做视频-2 Python中调用ComfyUI的API
在你的代码中,url = f”http://{server_address}/prompt” 是构造了一个指向 ComfyUI API 的“/prompt”端点的 URL,用于提交工作流并触发其执行,相当于在界面上点击“Queue”按钮。通过上述Python代码,可以成功解析“2Video文生视频-API.json”文件,并通过ComfyUI的API触发工作流的执行,模拟点击“Queue”按钮的行为。为了实现这一目标,我们需要使用ComfyUI的API,具体是通过HTTP请求向服务器发送工作流JSON。
2025-03-21 10:23:58
772
原创 AI教我做事之RAG开发-19 在医疗行业中被RAG可以处理的数据分析
在医疗行业中,数据类型多样,涵盖患者信息、临床测量、研究结果和行政记录等。这些数据在AI系统的检索增强生成(RAG)中具有重要作用,RAG通过从知识库中检索相关信息来增强生成模型的准确性和上下文相关性。以下是详细分析,包括数据类型的分类和哪些可以导入RAG系统。
2025-03-17 01:45:00
849
原创 AI教我做事之RAG开发-20 设计开放平台下的RAG
在AI的RAG(检索增强生成)研发领域,将RAG平台设计为内部工具,供其他部门使用,需要考虑软件架构设计和提供方式,以确保易用性、扩展性和安全性。以下包括架构建议、实现步骤和提供工具的便利性,旨在为组织内部部署提供全面参考。
2025-03-17 01:45:00
455
原创 AI教我做事之RAG开发-15 用EmbedChain进行RAG开发
在 AI 的 RAG(检索增强生成)开发中,RAG 是一种技术,通过从外部来源(如数据库或文档)检索信息来增强语言模型的生成能力,从而提供更准确和最新的响应。EmbedChain 是一个 Python 库,专注于创建和管理文本数据的嵌入,适合用于 RAG 管道的检索部分。它支持多种嵌入模型(如 Hugging Face 和 OpenAI),并提供与各种向量存储(如 FAISS、Pinecone)的集成。用户请求提供一个完整的 RAG 应用代码,使用 EmbedChain 框架。
2025-03-17 01:30:00
1689
原创 AI教我做事之RAG开发-17 RAG中不同的向量数据库的操作
以下是针对 RAG 开发中不同向量数据的读取和存储的详细分析和实现,基于当前时间(2025 年 3 月 12 日,太平洋夏令时晚上 10:42)的研究和实践。
2025-03-17 01:30:00
1791
原创 AI教我做事之RAG开发-18 主流向量数据库对比
开源状态:是否为开源,影响灵活性和社区贡献。成本:是否涉及使用费用,特别关注云服务的定价模型。扩展性:数据库处理向量数量的能力,分为高(数十亿向量)和非常高(数十亿以上)。性能:包括查询时间和索引时间,基于行业基准测试如 ANN Benchmarks 和 VectorDBBench。支持数据类型:除了向量和元数据,是否支持其他类型如 JSON、数组等。ML 集成:是否支持与机器学习框架(如 PyTorch、TensorFlow)和嵌入模型(如 Hugging Face、OpenAI)的集成。
2025-03-17 01:30:00
1203
原创 2Img.ai的AIGC课程-5-9 实现动作自由——Openpose姿态
大家可能会想起来,我们在初级课程中单独介绍过如何使用 OpenPose,见课程 4-2 OpenPose插件-人物动作,OpenPose 特点是可以检测到人体结构的关键点,比如头部、肩膀、手肘、膝盖等位置,而将人物的服饰、发型、背景等细节元素忽略掉。ControlTYpe是OpenPose的时候,就是将下图中,左侧小女孩的骨骼形态,简要的勾勒出来。这里其实是一个类似的东西,不同的是它寄宿于ControlNet的体系下,结合起来使用。模型文件:control_v11p_sd15_openpose.pth。
2025-03-13 10:18:48
232
原创 2Img.ai的AIGC课程-5-8 精细表面绘制——Normal法线
法线,它是垂直与平面的一条向量,因此储存了该平面方向和角度等信息。我们通过在物体凹凸表面的每个点上均绘制法线,再将其储存到 RGB 的颜色通道中,其中 R 红色、G 绿色、B 蓝色分别对应了三维场景中 XYX 空间坐标系,这样就能实现通过颜色来反映物体表面的光影效果,而由此得到的纹理图我们将其称为法线贴图。ControlNet 的 NormalMap 模型就是根据画面中的光影信息,从而模拟出物体表面的凹凸细节,实现准确还原画面内容布局,因此 NormalMap 多用于体现物体表面更加真实的光影细节。
2025-03-13 10:12:40
337
原创 2Img.ai的AIGC课程-5-7 理清空间关系——Depth深度
而 MiDaS 和 ZoE 更适合处理复杂场景,其中 ZoE 的参数量是最大的,所以处理速度比较慢,实际效果上更倾向于强化前后景深对比。Depth 模型可以提取图像中元素的前后景关系生成深度图,再将其复用到绘制图像中,因此当画面中物体前后关系不够清晰时,可以通过 Depth 模型来辅助控制。Depth或者说深度图,来源于三维相关的概念,描述了物体间的远近关系,非常技术性的术语。深度图也被称为距离影像,可以将从图像采集器到场景中各点的距离(深度)作为像素值的图像,它可以直接体现画面中物体的三维深度关系。
2025-03-13 10:10:43
355
原创 2Img.ai的AIGC课程-5-6 室内设计好帮手——MLSD直线
通过下面的图我们可以看到随着 Value 阈值的增大,被过滤掉的线条也就越多,最终图像中的线稿逐渐减少。MLSD模型是一个专门检测直线的模型,基于MLSD模型的特性,MLSD模型在建筑、室内方向的处理上是比较好的选择,可以很好的检测出原图的直线线条,可以从官方图中看到第一张,针对直线的抽取。总体来看边缘检测是非直线的,大部分是随意的轮廓曲线,而MLSD正相反,它关注的是图形中的直线内容。举个例子若原图室内环境中有人物出现,但是新生成的图片中不希望有人物,那么使用MLSD模型就可以很好的避开人物线条的检测。
2025-03-13 10:09:52
392
原创 2Img.ai的AIGC课程-5-5 拯救手残党——scribble涂鸦
通过随笔简单的勾勒出来一个轮廓图形,类似和边缘检测形成得到的物件轮廓图,再用RA/SD填充颜色和内容,形成实体图。Scribble 涂鸦,也可称作 Sketch 草图,同样是一款手绘效果的控图类型,但它检测生成的预处理图更像是蜡笔涂鸦的线稿,在控图效果上更加自由。可接受的预处理器:合成的涂鸦(Scribble_HED、Scribble_PIDI 等)或手绘的涂鸦。这里,随便画了山和河流,后侧还是试图生成对应的人物。下图中,通过简单的样条图,生成了丰富的图片。训练数据:合成的涂鸦。根据草图生成了真人。
2025-03-13 10:08:21
161
原创 2Img.ai的AIGC课程-5-4 最强线稿上色——Lineart线条艺术
lineart_anime 模型在参与绘制时会有更加明显的轮廓线,这种处理方式在二次元动漫中非常常见,传统手绘中描边可以有效增强画面内容的边界感,对色彩完成度的要求不高,因此轮廓描边可以替代很多需要色彩来表现的内容,并逐渐演变为动漫的特定风格。Canny 提取后的线稿类似电脑绘制的硬直线,粗细统一都是 1px 大小,而 Lineart 则是有的明显笔触痕迹线稿,更像是现实的手绘稿,可以明显观察到不同边缘下的粗细过渡。主要的内容也就是想根据线条相关的外轮廓,内部轮廓,识别生成出来对应的实体图。
2025-03-13 10:07:02
349
原创 2Img.ai的AIGC课程-5-3 精细手部线条控制——SoftEdge软边缘检测
鲁棒性:SoftEdge_PIDI_safe > SoftEdge_HED_safe >> SoftEdge_PIDI > SoftEdge_HED。可接受的预处理器:SoftEdge_PIDI、SoftEdge_PIDI_safe、SoftEdge_HED、SoftEdge_HED_safe。软边缘顾名思义,检测的边缘会显得稍微柔和些。训练数据:SoftEdge_PIDI、SoftEdge_PIDI_safe、SoftEdge_HED、SoftEdge_HED_safe。RA/SD 衍生者AI训练营。
2025-03-13 10:05:38
856
原创 2Img.ai的AIGC课程-5-2 实物转手绘——Canny硬边缘检测
在选择预处理器时,我们可以看到除了 canny(硬边缘检测)还有 invert(白底黑线反色)的预处理器选项,它的功能并非是提取图像的空间特征,而是将线稿进行颜色反转。我们通过 Canny 等线稿类的预处理器提取得到的预览图都是黑底白线,但大部分的传统线稿都是白底黑线,为方便使用,很多时候我们需要将两者进行颜色转换,传统做法都是导出到 PS 等工具进行额外处理,非常繁琐。当然边缘的准确性,柔和行,要求也不一致。因此,可以通过多次尝试后,针对不同的模型底稿,不同的业务场景,总结出来各自的心得和经验。
2025-03-13 10:03:14
476
原创 2Img.ai的AIGC课程-5-1 ControlNet插件的设置与原理
前面介绍的RA/SD已经非常强大,再搭配ControlNet期待会让你进入高手行列。ControlNet是什么,我们需要学哪些,做到哪些是一个庞大的体系。甚至都可以和RA/SD并驾齐驱了。并且ControlNet也非常的通用。分别可以独立且兼容的运行在我们的RA/SD产品和RA/CU产品体系中。实现同样的效果和满足类似的业务需求。ControlNet的课程相对很多,同时学习难度也有提升,需要你仔细吸收。更多资源进。
2025-03-13 09:46:56
932
微软2023年度新未来工作报告
2024-07-10
XDataverse是一款通用的数据库管理工具,主要管理关系型数据库
2022-10-26
SerialPort串口调试工具
2020-02-05
SqlCeViewer0409
2009-10-27
Sql Ce Viewer_WPF
2008-02-14
SQL CE Viewer
2007-10-08
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人