- 博客(101)
- 资源 (1)
- 收藏
- 关注
原创 【Agent】LangManus深度解析:AI自动化框架的对比与langgraph原理
LangManus是一个由社区驱动的开源AI自动化框架,其核心价值在于通过分层多智能体系统,协调语言模型(如通义千问)与专业工具(如Tavily搜索、Jina神经搜索、Python执行环境),解决跨平台数据采集与分析、自动化代码生成与调试、复杂决策任务的分解与执行等场景。langgraph是由LangChain团队开发的一个专门用于构建LLM应用工作流的框架,它的核心理念是将复杂的LLM应用工作流表示为有向图(Directed Graph)。
2025-04-25 23:04:03
1122
原创 HTTP/2 服务器端推送:FastAPI实现与前端集成指南
本文将会讲解HTTP2协议和相关配置实践。但是不要混淆,SSE的实现完全基于HTTP/1.1的持久连接机制,通过长连接实现实时数据推送。尽管HTTP/2的服务端推送也能主动发送数据,但其设计目标和应用场景与SSE不同,两者属于互补而非替代关系。若需实现服务端到客户端的单向实时通信,SSE仍是更轻量且兼容性更优的方案。
2025-03-02 18:39:29
1018
原创 【Datawhale wow-agent】深入浅出:构建你自己的 LLM 工具调用Agent与 RAG 系统
首先,我们需要创建一个自定义的 LLM 类来封装大语言模型的调用。CustomLLM,@property通过以上步骤,我们实现了一个基础的 LLM 工具调用和 RAG 系统。执行基础的数学运算查询数据库解析和检索 Markdown 文档回答基于知识库的问题你也可以基于这个框架,根据自己的需求扩展更多功能。
2025-01-17 02:25:31
698
原创 【GraphRAG】LEGO-GraphRAG框架解读
LEGO-GraphRAG框架为我们提供了一个强大的工具,以应对GraphRAG在实际应用中的挑战。通过模块化设计和系统化的解决方案分类,LEGO-GraphRAG不仅提高了检索准确性和推理效果,还为未来的研究和应用指明了方向。随着技术的不断发展,我们期待LEGO-GraphRAG能够在更广泛的领域中发挥其潜力,推动基于知识图谱检索增强生成的发展。
2024-12-30 14:34:20
844
原创 【机器学习】CatBoost 模型实践:回归与分类的全流程解析
CatBoost 是由俄罗斯搜索巨头 Yandex 于 2017 年开源的机器学习库,其名称来源于 “Category” 和 “Boosting” 的组合,旨在高效处理类别特征的梯度提升算法。支持类别特征:无需对类别特征进行独热编码,直接处理类别数据,避免数据膨胀。对缺失值的鲁棒性:无需特殊预处理即可直接处理缺失值。防止过拟合:内置多种正则化手段,减少梯度偏差和预测偏移,提高模型的准确性和泛化能力。对称树结构。
2024-11-30 22:42:07
2893
4
原创 【报告研读】旅程学习 Journey Learning: A New Paradigm for AI Training
旅程学习是一种新兴的AI训练方法,强调不仅仅依赖“捷径”获得结果,而是学习整个探索过程,包括试错、反思和回溯。与传统的“捷径学习”相比,旅程学习更加关注AI系统的持续进步,能够应对复杂、动态和开放性问题。作者的复刻探索本身也可以看作一个旅程学习。最近在10.16 他们还发布了一个327条记录的训练数据集:旅程学习是一种革命性的方法,它超越了传统的捷径学习,提供了更强的泛化能力和推理深度。旅程学习已成功应用于复杂数学问题的求解,以及开放式问题的推理。
2024-10-24 01:22:06
1068
原创 【论文导读】Graphusion (LLM + KGC)
本研究探讨了大型语言模型(LLM)在自然语言处理教育领域的应用潜力,着重于概念图谱恢复和问答任务。研究人员评估了LLM在零样本情况下的概念图谱恢复能力,并引入了一个由专家验证的NLP专注于科学图论推理和问答的新基准TutorQA。CGLLM是一个将概念图谱与LLM集成以回答各种问题的工作流。实验结果表明,LLM在零样本情况下具有与监督方法相当的概念图谱恢复能力,并且在TutorQA任务中实现了高达26%的F1得分提升。此外,人类评价和分析显示,CGLLM可以生成更细粒度的概念答案。
2024-09-30 14:50:00
1565
原创 【Datawhale AI 夏令营】第四期 基于2B源大模型RAG 的三体问答
【Datawhale AI 夏令营】第四期 基于2B源大模型RAG 的三体问答,特点:手工文档切块、调优。
2024-08-14 11:54:30
1112
原创 【Datawhale AI 夏令营】第四期 浪潮源模型部署测试+解析
定位:Datawhale AI 夏令营 第四期 Task1 笔记内容:小结实践顺序 + 记录过程疑惑点。
2024-08-10 18:13:37
1071
2
原创 【GraphRAG】微软 graphrag 效果实测
本次测试中,global的测试输出不够理想。但是local的输出十分nice。简单的如果不是local和global的含义错了,即便是local的似乎也能进行全局性总结?local的生成基于更加细致的节点,比global的生成更加自然。如果以博客内容为准,也可能是因为复用同一个处理摘要总结时候的prompt,但是GPT4和豆包对这个prompt的响应敏感程度和生成倾向不同。
2024-07-17 15:22:47
4307
4
原创 Cocos2dx 编译游戏安装包制作教程
本篇博客希望你不仅掌握了如何在 Visual Studio 项目中设置 .exe 文件的图标,还学会了使用 Inno Setup 创建包含自定义图标和安装路径的安装包。我们还探讨了如何解决在目标机器上运行游戏时可能遇到的 DLL 缺失问题。希望这篇教程能帮助你更顺利地发布和分享你的游戏。
2024-06-10 01:40:08
1396
原创 基于Whisper+SparkAI+Pyttsx3实现全流程免费的语音交互
HTTPS 协议:大多数现代浏览器只允许在 HTTPS 协议或localhost上使用摄像头和麦克风等硬件设备。如果你在开发环境中使用 HTTP,可能会遇到为undefined的问题。建议在开发和生产环境中都使用 HTTPS。你可以使用ngrok或serveo.net等工具将本地服务器暴露为 HTTPS 服务。权限问题:在调用时,需要处理用户拒绝权限请求的情况。可以通过捕获错误并提示用户检查权限设置来解决。音频格式:确保录音和处理音频数据时使用正确的格式,如audio/wav。
2024-05-31 22:04:24
1342
原创 【langchain】快速封装替换自定义LLM(基于自定义API或本地模型)
本文旨在展示如何利用langchain快速封装自定义LLM,从而突破现有环境下对OpenAI API Key的依赖。通过langchain的LLM类或现有项目的类继承,再修改特定的回调方法即可实现更加个性化和灵活的LLM应用,推动项目快速进展。
2024-04-30 15:00:25
7914
6
原创 【MetaGPT】多智能体协作——你画我猜(文字版)
多智能体系统 (Multi-Agent System, MAS) 是由一群具有一定自主性、协同性和学习能力的智能体组成的系统。智能体在环境中相互协作,以达到某种目标或完成特定任务。概念: Environment 是多智能体系统中的一个核心概念,类似于强化学习中的环境。它为智能体提供了一个交互和通信的平台。组成desc: 描述环境信息。roles: 指定环境中的角色及其状态。members: 表示环境中的角色及其对应的状态。history: 记录环境中发生的消息。功能。
2024-03-07 16:05:24
1408
原创 【MetaGPT】单智能体多动作实践——AI小说家
我们借着 技术文档生成 以及 小说生成 为例, 主要学习了Action、Role、Memory概念。当然,其中重要的概念不止这些,包括传递的消息类Message。在MetaGPT框架中,一个智能体封装成一个角色🤖(Role)。一个角色往往具有:大语言模型加持的大脑(可选)能够记住自己之前做过什么的记忆(可选)
2024-03-02 22:32:45
2276
3
原创 【MetaGPT】配置教程
ICLR 2024录用结果公布:MetaGPT 的论文 《MetaGPT: Meta Programming for A Multi-Agent Collaborative Framework》将被展示为Oral(口头报告)。一共对话5次,中途发生了一点点的网络问题,不过问题不大,依旧能继续执行下去。更新飞快,兴许以后的版本就不同了。安装之后,可以新建一个项目目录来检索默认的配置文件地址。至此,我们就可以直接运行代码,得到如下输出结果。文件,我们在此设置智谱AI的配置。替换为您的智谱AI API密钥。
2024-02-28 00:34:48
2461
6
原创 【机器学习】决策树
决策树(Decision Tree)用于分类和回归任务。它通过构建树状模型来进行决策。决策树算法的基本思想是基于数据特征进行递归分裂。每个内部节点代表一个特征上的测试,每个分支代表测试的结果,而每个叶节点代表一个类别(在分类树中)或一个具体的数值(在回归树中)。决策树算法的优点包括:模型易于理解和解释,不需要对数据进行太多预处理,可以处理数值型和类别型数据。不过,决策树也有限制,比如容易过拟合,尤其是当树变得很复杂时。为了解决这个问题,通常需要剪枝或者通过集成方法(如随机森林)来提高模型的泛化能力。
2024-02-08 16:05:14
2311
1
原创 【强化学习】QAC、A2C、A3C学习笔记
相比REINFORCE算法,为什么A2C可以提升速度?A2C增加了Critic组件用于估计状态价值,这样Actor可以利用Critic提供的价值信息来更新策略,使得学习过程更加高效。A2C、A3C是on-policy的吗?A2C算法是on-policy的,因为它根据当前策略生成的样本来更新这个策略,这意味着它评估和改进的是同一个策略。A3C算法虽然采用了异步的更新机制,但它本质上仍然是on-policy的。
2024-01-23 19:10:08
2013
原创 【强化学习】DQN、Double DQN、Dueling DQN、Per DQN、NoisyDQN 学习笔记
Dueling DQN修改的是网络结构,算法中在输出层之前分流( dueling )出了两个层,如图所示,一个是优势层,用于估计每个动作带来的优势,输出维度为动作数一个是价值层,用于估计每个状态的价值,输出维度为 1。在传统的DQN中,选择和评估动作的Q值使用相同的网络,这可能导致在某些状态下对某些动作的Q值被高估,从而影响学习的稳定性和最终策略的质量。经验回放:通过存储代理的经验(状态,动作,奖励,新状态)在回放缓存中,并在训练时从中随机抽样,这样做可以打破数据间的时间相关性,提高学习的稳定性和效率。
2024-01-17 21:31:54
2181
2
原创 【强化学习】基于蒙特卡洛MC与时序差分TD的简易21点游戏应用
本次实验所应用的三种策略Q-learning、Sarsa和蒙特卡洛都是解决强化学习问题的算法,它们在学习过程中都通过与环境的交互来优化策略。且都用于值函数估计,这三种算法的目标都是学习状态或状态动作对的值函数,即Q值或V值。更新方式不同:Q-learning: 使用了离线学习的方式,通过选择当前状态下值最大的动作来更新Q值。更新公式中使用了max操作。Sarsa: 使用在线学习的方式,通过选择当前状态下的某个动作来更新Q值。更新公式中使用了当前实际选择的动作。蒙特卡洛: 通过整个回合(
2023-12-28 19:49:18
1906
原创 【强化学习】动态规划算法实践
强化学习的DP方法实践:策略迭代Policy Iteration(内含策略评估Policy Evaluation + 策略优化Policy Improvement)+ 价值迭代Value Iteration
2023-11-26 16:56:54
1235
1
原创 【论文研读】Minimax and Biobjective Portfolio Selection Based on Collaborative Neurodynamic Optimization
投资组合选择是金融投资中的重要问题之一。本文研究了基于协同神经动力学优化的投资组合选择。将经典的马科维茨(Markowitz)均值方差(MV)框架及其变体均值条件风险值(CVaR)表述为极小极大和双目标投资组合问题。然后应用神经动力学方法求解这些优化问题。对于每个问题,多个神经网络协同工作,通过基于**粒子群优化(PSO)**的权值优化来表征有效边界。基于四个主要市场股票数据的实验结果显示了协同神经动力学方法在组合优化问题上的性能和特点。
2023-10-24 11:24:18
387
原创 【Python】读取显示pgm图像文件
这学期要学多媒体信息隐藏对抗,发现其中的图像数据集文件都是pgm文件形式的。虽然是图像文件,但是却不能直接通过图像查看器来打开,上网一搜:”如何打开pgm文件?“多半是使用第三方软件photoshop之类的。都是能写代码的人了,难道为了看几张图片还要下一个几G软件吗?至此,我就开始考虑如何使用python读取pgm(Portable Gray Map)文件并显示出来。
2023-10-06 10:25:49
3108
原创 【强化学习】基础概念
智能体状态(Agent State)指其内部的信息,而环境状态(Environment State)指外部的环境信息。智能体是进行决策和学习的实体,它能感知环境的状态,并基于策略采取动作以影响环境。智能体的目标是通过与环境的交互获得最大化的累积奖励。环境的状态可能对智能体可见(如游戏中的棋盘状态),也可能对智能体不可见(如对手的策略)。动作是智能体基于观察到的状态所做出的决策或行为,影响环境的转移。在强化学习中,智能体需要在已知最佳动作的基础上进行利用以获得奖励,同时也需要探索未知动作以发现更优的策略。
2023-09-30 15:47:00
345
原创 【CSS】网格布局(简单布局、网格合并、网格嵌套)
CSS网格布局是一种强大的CSS布局系统,它简化了页面的布局和定位,同时适应不同屏幕大小的需求。通过使用grid-row和等属性,我们可以轻松地实现简单到复杂的网格布局。网格合并和嵌套使得在网格中创建复杂的布局变得更加简单和灵活。
2023-08-08 22:01:05
3498
原创 【强化学习】Q-learning训练AI走迷宫
Q-learning是一种基于强化学习的算法,用于解决Markov决策过程(MDP)中的问题。这类问题我们理解为一种可以用有限状态机表示的问题。它具有一些离散的状态state、每一个state可以通过动作action转移到另外一个state。每次采取action,这个action都会带有一些奖励reward(也可以是负数,这样就表示惩罚了)。在Q-learning中,我们有一个智能体(Agent)和一个环境(Environment)。智能体可以在环境中执行动作,并从环境中获取奖励作为反馈。
2023-07-27 10:14:28
4072
7
原创 【机器学习】KNN算法
KNN算法(K-Nearest Neighbors)是一种基于实例的学习算法,它通过度量样本之间的相似性来进行分类或回归。KNN算法的基本思想很简单:对于一个未知样本,它的类别或输出值可以通过与训练集中最近邻居的比较来确定。这里的"最近邻"是指距离新样本最近的K个训练集样本。KNN算法的优点是简单易懂,不需要进行显式的训练过程,而且在处理非线性问题或数据较为复杂的情况下表现良好。然而,KNN算法也有一些限制。例如,它在处理大规模数据时可能会变得较慢,因为需要计算新样本与所有训练样本之间的距离。
2023-07-19 23:02:52
1223
1
原创 llama_index中query_engine的response_mode详解
在使用llama_index进行内容提炼、文章总结时,我们可以通过设置不同的ResponseMode来控制生成响应的结果。
2023-06-05 19:36:24
3028
2
原创 使用langchain及llama_index实现基于文档(长文本)的相似查询与询问
langchain是一个功能强大的库,它为我们提供了许多方便的工具和模型,包括OpenAI模型。它通过链式调用的方式将这些组件连接在一起,创造出一个连贯的应用程序。同时,langchain还提供了内存组件Memory,可以帮助我们管理之前的聊天消息,以及Indexes和Agents等功能。LlamaIndex(GPT Index)是一个用于LLM应用的数据框架,集成了langchain及chatgpt相关应用,更便于我们实现结构化数据和高级检索的相关功能。
2023-05-31 20:01:41
12280
6
原创 【五一创作】跑alpaca-lora语言模型的常见问题(心得)
Alpaca-Lora是一个开源的自然语言处理框架,使用深度学习技术构建了一个端到端的语言模型。在训练和部署alpaca-lora语言模型时,可能会遇到一些常见问题。本文将介绍一些这些问题及其解决方法。
2023-04-30 05:00:00
2576
6
原创 【CSDN竞赛】42期题解(Python + Javascript)
4.1的时候发现有些ACM模式下的题目用python真的咔咔乱杀。(相比C、C++)虽然作为动态语言的JS也简单,但有些时候别人的编译器不认Javascript,却认python。所以打算适当用点Python解题。这期前两题简单,不需要多高级的语法,就使用Python了。后面两题虽然也简单,但是JS两题不用,如隔三秋,便又用回JS了。
2023-04-08 00:47:43
831
原创 C++常用字符串string方法
string.h>和这两个头文件唯一的区别是,cstring是C++标准库中的头文件,而string.h是C标准库中的头文件。方法返回的是子字符串在字符串中的位置,如果找不到则返回。:用指定的字符串替换从指定位置开始的指定长度的字符。:返回字符串中从指定位置开始的指定长度的子字符串。:将指定的字符串追加到当前字符串的末尾。:将一个字符串追加到另一个字符串的末尾。:将一个字符串复制到另一个字符串中。:在字符串中查找指定的子字符串。:返回字符串中指定位置的字符。
2023-03-30 23:59:13
953
1
原创 C++中常见的容器类使用方法举例(vector、deque、map、set)
C++中常见的容器类有vector、list、deque、map、set、unordered_map和unordered_set。下面将举例直接说明各个容器的使用方法。
2023-03-30 10:07:05
1118
原创 实现卡片高度增加时的缓动动画效果
在开发中,我们可能会遇到需要让卡片高度由内容撑起(即不能手动设置height),并且在高度增加时增加缓动动画的需求。本文将介绍几种实现方式。
2023-03-29 00:11:53
2243
原创 【遗传算法】——更高级的猜猜法
学习遗传算法有2个月了,最近也开始读汪民乐、高晓光、范阳涛三位先生编著的《先进遗传算法及其工程应用》,记录这几个月我对遗传算法的浅显理解。
2023-02-18 16:29:02
998
python星号三角形
2023-11-18
Linux 操作系统之文件系统 实验报告
2023-07-19
百度掘金,提取测试题答案数据
2023-04-30
微信小程序请求报错412 Precondition Failed
2023-10-12
如何实现在公众号内调起web页面,再通过web页面跳转到小程序
2023-10-05
OpenResty卸载或配置
2023-09-18
Vue3 项目打包style样式丢失
2023-09-10
uniapp中引入TDesign
2023-08-13
遗传算法种群初始化的优化必要性
2023-02-22
Javascript的代码执行与测试
2022-10-29
Java 比较两张图片的相似度
2022-10-18
TA创建的收藏夹 TA关注的收藏夹
TA关注的人