自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(76)
  • 收藏
  • 关注

原创 十、100行代码实现简易通用智能 LLM AGENT

LLM AGENT 简易通用智能

2025-04-27 17:25:55 772

原创 九、大模型私有化部署 - vllm

vllm 私有化部署大模型服务

2025-04-23 16:44:39 713

原创 八、大模型私有化部署 - FastChat

fastchat 私有化部署大模型

2025-04-21 15:22:36 891

原创 七、LangChain Tool类参数对接机制解析:基于Pydantic的类型安全与流程实现

LangChain 的 类(包括 和 )通过 参数校验、输入解析、函数调用 的流程,将外部函数与 Agent 的逻辑对接。

2025-04-18 17:25:28 843

原创 六、LangChain Agent 最佳实践

LangChain Agent 最佳实践。

2025-04-18 16:30:07 752

原创 五、Agent+大模型:解锁AI新维度

Agent 是一个以任务驱动、具备自主能力的智能体,其核心是大模型(如LLM),并集成任务规划、记忆管理、工具调用等功能模块。

2025-04-18 11:56:12 562

原创 四、探索LangChain:连接语言模型与外部世界的桥梁

LangChain 是一个开源的,旨在帮助开发者高效构建和部署基于**大型语言模型(LLM)**的应用程序。它通过提供一系列工具、组件和接口,简化了从模型调用、提示工程到复杂应用开发的全流程,使得开发者能够快速将 LLM 集成到实际场景中。LangChain 提供了对主流 LLM(如 OpenAI、Anthropic、HuggingFace 等)的,支持开发者通过统一的 API 调用不同模型,无需重复适配不同提供商的接口。结合工具如。

2025-04-17 12:15:18 1009

原创 三、RAG与LLM:构建智能检索增强生成系统

RAG(检索增强生成) 是结合检索模型与生成模型(如LLM)的技术,通过从外部知识库中检索相关信息,增强生成模型的上下文理解与回答准确性,解决传统模型的“知识时效性”和“幻觉”问题。其核心流程包括:文本分割(将文档切分为合适粒度的块)、检索(快速定位相关文本)、重排序(优化结果相关性)和生成(基于精选内容输出答案)。RAG 广泛应用于问答系统、推荐等场景,平衡了语义精度与计算效率,显著提升复杂任务的生成质量。

2025-04-15 18:09:47 669

原创 二、The Power of LLM Function Calling

Function Calling(函数调用) 是大型语言模型(LLM)通过调用外部工具、API或自定义函数来扩展自身能力的核心机制。它允许模型突破预训练知识的限制,直接与外部系统交互,完成动态任务(如实时数据查询、执行操作等)。以下是对其核心概念、工作原理、优势及应用场景的详细解析:定义:与传统 LLM 的区别:Function Calling 的典型工作流程如下(以知识库中的描述为例):定义函数: 用户请求:模型解析与决策:生成函数调用指令: 执行函数并返回结果

2025-04-15 17:03:15 776

原创 一、LLM 大语言模型初窥:起源、概念与核心原理

从AI 1.0到AI 2.0的变迁,本质是技术从“专用工具”向“通用智能平台”的质变。大模型通过参数规模、模态融合与训练效率的突破,重构了技术范式、产业生态与人机关系。未来,AI将不仅是效率工具,更是推动社会生产力跃迁的核心引擎,其发展需在技术创新与伦理治理间寻求动态平衡。生成式模型是一类能够通过算法学习数据分布,并基于此生成新数据的人工智能技术。它的核心在于从已有数据中提取模式,创造出与训练数据相似但全新的内容,涵盖文本、图像、音频、视频等多种模态。

2025-04-12 12:34:18 762

原创 Python 导入上级目录模块的方法

【代码】Python 导入上级目录模块的方法。

2025-03-26 15:37:35 182

原创 第一章 知识图谱概述

知识图谱是一种用图模型来描述知识和建模世界万物之间的关联关系的技术方法。知识图谱由节点和边组成。节点可以是实体,如一个人、一本书等,或是抽象的概念,如人工智能、知识图谱等。边可以是实体的属性,如姓名、书名,或是实体之间的关系,如朋友、配偶。知识图谱的早期理念来自Semantic Web(语义网),其最初理想是把基于文本链接的万维网转化成基于实体链接的语义网。图:知识图谱:事务关系的可计算模型。

2025-03-21 15:50:10 118

原创 知识图谱入门指南:从零到实战

知识图谱构建全流程实战。

2025-03-17 11:21:39 217

原创 从零掌握PostgreSQL:新手万字全指南(2025版)

从零掌握PostgreSQL:新手万字全指南(2025版)

2025-03-13 11:40:33 165

原创 Redis大Key问题全解析:从原理到实战的深度解决方案

设计规范选择与业务匹配的数据结构预估数据量级(如用户增长模型)工具链建设上线前使用扫描生产环境部署RedisInsight实时监控应急方案制定BigKey处理SOP(如凌晨低峰期删除)定期演练大Key迁移预案架构演进超过10GB的Key考虑迁移至TiKV等分布式存储结合Pika实现冷热数据分层。

2025-03-10 17:39:58 534

原创 Redis从入门到精通:数据结构、持久化与高可用设计

Redis(motectionaryerver)是一个开源的,支持分布式架构和持久化存储。Redis将所有数据存储在内存中,读写操作无需磁盘I/O,(读11万次/秒,写8.1万次/秒)。同时支持RDB快照和AOF日志两种持久化机制,确保数据安全。:字符串(String)、列表(List)、哈希(Hash)、集合(Set)、有序集合(ZSet)。SETNX。

2025-03-05 16:15:18 140

原创 flask request对象在多线程环境下的线程安全问题

Flask 的设计中, 对象作为一个全局对象来使用,这可能会让人感到困惑,因为通常情况下,全局对象在多线程环境下使用可能会导致线程安全问题。然而,Flask 通过使用一种称为 “上下文局部”(local context)的机制来解决这个问题,确保 对象能够在多线程环境中安全地被使用。上下文局部(Context Local)是一种编程概念,常用于在多线程或异步编程环境中管理和隔离上下文相关的对象和数据。在 web 开发中,尤其是在使用框架如 Flask 时,上下文局部常用于确保数据在同一个请求或会话中是线程

2024-12-06 11:51:05 1065

原创 django template 模板渲染

Django 的模板系统旨在使设计人员能够编写 HTML,同时以一种安全和灵活的方式动态显示数据。这种分离关注点的设计允许后端开发人员处理业务逻辑,而模板专注于数据的展示。Django 的模板系统通过直观的语法和强大的功能分离了表现层和业务逻辑,使得开发过程更简洁和易维护。无论是简单的静态展示还是复杂的动态页面,Django 的模板都提供了足够的灵活性和安全性来应对各种需求。通过模板继承、过滤器和标签,开发者可以高效地构建精美的用户界面并确保代码的可重用性。

2024-12-05 16:45:33 296

原创 django URL路由系统

Django 的 URL 路由系统灵活且强大,提供了多种工具来管理和解析复杂的 URL。其中,模块化的设计(通过include)和反向解析为大型项目的管理提供了便利,路径转换器和正则表达式增强了模式匹配能力。通过这些特性,开发者可以充分利用 URL 路由系统来设计清晰且高效的 Web 应用程序。

2024-12-05 15:31:45 286

原创 django request 请求流程

Django 的请求处理流程是其框架设计的核心部分,涉及到多个组件的协作来将用户的 HTTP 请求转换为响应。了解这个流程有助于理解 Django 如何运作,以及如何优化应用程序的性能和安全性。

2024-12-05 15:06:38 502

原创 django MVT 和 MVC

Django 是一个流行的 Web 框架,以其简洁、优雅和强大的功能而闻名。它采用了 MVT(Model-View-Template)架构模式,这与 MVC(Model-View-Controller)模式有着密切的关系。了解 Django 的 MVT 和传统的 MVC 之间的异同,可以帮助我们更好地理解 Django 的设计理念和运作方式。

2024-12-05 11:58:18 873

原创 django STATIC_URL、STATIC_ROOT 和 STATICFILES_DIRS

在Django项目中,STATIC_URL和是用来管理静态文件的重要设置。STATIC_URLSTATIC_URLSTATIC_URL这意味着所有的静态文件可以通过/static/前缀来访问,例如会生成。这里,BASE_DIR是项目的根目录,被设置为。这意味着所有收集的静态文件会被放置在项目根目录下的文件夹中。这里,目录位于项目根目录下,你可以在这个目录中存放一些额外的静态文件,比如全局的CSS或JavaScript文件。

2024-12-02 16:49:44 820

原创 helm 使用 helm 基本操作

【代码】helm 使用 helm 基本操作。

2024-11-25 16:54:50 227

原创 helm 概念入门

Helm 是 Kubernetes 的一个包管理工具,它简化了在 Kubernetes 上的软件部署和管理过程。Helm 类似于操作系统中的包管理器(如 apt、yum、homebrew),它使用称为 “charts” 的模板化配置来定义、安装和管理 Kubernetes 应用程序。

2024-11-21 15:12:14 461

原创 kubernetes ARM版 离线部署k8s

在ARM架构的硬件上离线部署Kubernetes以及KubeSphere,你需要提前准备所有必要的二进制文件、镜像和其他资源,因为ARM架构下的软件包可能与x86架构不同。

2024-11-20 17:15:19 2087 2

原创 kubernetes socat、conntrack、ebtables、ipset的各自用途是什么?

通过结合这些工具,Kubernetes能够高效地管理复杂多样化的网络需求,帮助运维人员实现集群内外的流量控制、负载均衡和安全管理。在Kubernetes环境中,这些工具扮演着重要角色,协助管理集群的网络和流量。

2024-11-18 15:06:20 502

原创 containerd ARM版 二进制安装containerd

由于 containerd 需要调用 runc,所以我们也需要先安装 runc,不过 containerd 提供了一个包含相关依赖的压缩包,可以直接使用这个包来进行安装。

2024-11-18 10:51:30 1117

原创 MySQL docker部署生产级MySQL服务&&数据迁移

创建本地目录以持久化数据。拉取MySQL Docker镜像。创建Docker网络(可选,用于容器间通信)。配置并启动MySQL容器。

2024-11-18 10:24:36 528

原创 containerd AMD版 二进制安装containerd

runc是一个在容器中启动和管理运行时的组件,也是 containerd 的一部分。

2024-11-14 15:15:08 619

原创 containerd ctr run 与 ctr containers create+ctr tasks的区别

简易性与详细控制ctr run提供了一种快速、一体化的方式来实现从镜像到容器运行的完整流程,简化了许多操作步骤。ctr tasks提供更详细的控制,适用于需要精细化管理、调试和特定定制的场景。管理复杂性ctr run适合快速启动和测试用例,在命令简单且无需细致管理时便捷。对于需要长期运行或者在容器启动前后需要做更多额外处理的情况,分步骤进行的细粒度控制允许更高的透明度和灵活性。两者本质上实现的目标是一致的,即在containerd环境中启动并运行容器,不同的只是执行细节和应用场景。

2024-11-14 10:58:45 543

原创 containerd task 任务管理

任务是containerd内部管理容器运行过程中的重要概念,把容器的定义与其执行分开,实现了精细化管理和更好的运行时隔离。对于容器技术及其实现机制有更深刻理解的人来说,这将带来显著的好处,如优化资源使用和提升系统健壮性。

2024-11-14 10:49:58 424

原创 containerd ctr 常用命令

ctr是 Containerd 的命令行客户端工具,提供了与 Containerd 交互的多种命令。虽然它主要用于调试和开发环境,但它提供了丰富的功能,可以对容器、镜像、快照、任务等进行管理。以下是一些常用的ctr。

2024-11-14 10:43:44 622

原创 containerd 命令行工具 ctr 与 crictl

开发和低级控制:如果你需要对containerd进行深入的开发和调试,ctr提供了完全的控制权限和低级访问。Kubernetes 环境管理:如果你是在 Kubernetes 环境中进行运维,crictl是一个简化的、符合 CRI 的工具,使得查看和管理工作变得更加容易。在实际使用中,选择工具取决于用例和环境:如果是调试containerd或者进行开发,ctr提供了直接的接口;而在 Kubernetes 环境中,crictl是简化运维管理的优秀工具。

2024-11-14 09:55:39 550

原创 containerd 概述

Containerd 是一种知名的开源容器运行时,作为容器生态系统的基础组件之一。它专注于高效地管理操作系统级的容器,包括容器的生命周期和底层的基础管理操作。

2024-11-14 09:42:30 493

原创 Linux uname -a 区分Linux服务器处理器的架构 ARM or AMD

用 uname -a 命令可以查看Linux系统的内核信息,包括处理器架构类型。对于处理器架构,主要看返回字符串中的关键字,它们通常出现在描述系统架构的部分。

2024-11-13 11:25:44 733

原创 KubeSphere Images for v4.1.2(通过邮箱获取)

【代码】KubeSphere Images for v4.1.2(通过邮箱获取)

2024-11-13 10:39:21 587

原创 Algorithms 递归 - 汉诺塔

汉诺塔(又称河内塔)问题是源于印度一个古老传说的益智玩具。大梵天创造世界的时候做了三根金刚石柱子,在一根柱子上从下往上按照大小顺序摞着64片黄金圆盘。大梵天命令婆罗门把圆盘从下面开始按大小顺序重新摆放在另一根柱子上。并且规定,在小圆盘上不能放大圆盘,在三根柱子之间一次只能移动一个圆盘。现有三根柱子,一个柱子套着 n 圆盘,且大的圆盘放在下面,从大到小往上叠放。规则是,大圆盘不能压着小圆盘,最终效果为保持原有顺序;一次只能移动一个圆盘。现在,需要将圆盘套到另一个柱子,问,如何以最少的次数移动完成?

2024-11-13 09:46:08 207

原创 Algorithms 归并排序

时间复杂度:O(nlogn)注意:需要额外的内存开销。

2024-11-13 09:44:43 239

原创 Algorithms 快速排序

极端情况:有序list,使用快排,时间复杂度为 n²。时间复杂度:O(nlogn)

2024-11-13 09:43:52 177

原创 Algorithms 插入排序

【代码】Algorithms 插入排序。

2024-11-13 09:43:06 227

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除