- 博客(533)
- 资源 (8)
- 收藏
- 关注
原创 如何构建一个提供LLM运行环境的镜像
如果想在本地搭建LLM的运行环境,使用镜像是一个很好的选择本文提供基于python 3.10版本,使用poetry管理依赖,快速搭建LLM运行环境的镜像的脚本。
2025-04-10 09:40:40
45
原创 Trio:快速掌握Python并发编程的神器
Trio 是一个友好的 Python 库,用于异步并发和 I/O。它提供了一种简单且强大的方式来编写并发程序。本文将介绍如何使用 Trio 快速开发并发应用,包括与 Python 原生 async/await/coroutine 的区别、Trio 的优劣势、如何开发多任务并发的后端、如何开发多任务并发的 WEB 后端以及使用 Trio 的注意事项等。
2025-03-29 19:42:20
706
原创 使用 Docker Compose 的 COMPOSE_PROFILES 变量:模块化你的应用部署
利用 Docker Compose 的 COMPOSE_PROFILES 环境变量及其 profiles 功能,开发者可以更加灵活和高效地管理复杂的应用部署。无论是为了简化开发流程还是优化生产环境的部署策略,这个特性都提供了一种优雅的解决方案。
2025-03-25 10:23:12
841
原创 2025-工具集合整理
Docker Image Puller 是一个方便的工具,用于从 Docker 仓库拉取镜像,支持国内镜像源加速和多架构支持。该工具采用 MIT 许可证,开放源代码,方便用户根据需要进行定制和扩展。TikTok 发布/喜欢/合辑/直播/视频/图集/音乐;easyexcel作者最新升级版本, 快速、简洁、解决大文件内存溢出的java处理Excel工具。
2025-02-02 21:44:13
567
原创 AI Agent相关的设计图
LLM Agent 是一个基于大型语言模型的智能代理,能够执行复杂的任务。它通常结合了多种工具和API,以完成特定的目标。LLM Agent 可以根据上下文动态调整其行为,并且能够处理多步骤的任务。
2025-01-26 11:49:50
462
原创 2024年年终看LLM的发展方向
如今的大模型已经能够满足95%用户的需求,涵盖信息抽取、方案设计、表格生成、简单代码编写、简单问答、简单服务调用等领域,这95%的需求大多是简单任务,对模型的能力要求不高。因为大多数的用户日常并不需要模型具备复杂的逻辑推理能力。剩下5%涉及复杂逻辑推理的需求,隐藏着AGI的技术瓶颈,代表着以o1为典型的新技术范式,但需要投入天价的算力本文回顾2024年LLM的发展记录及针对2025年LLM发展方向的展望。
2024-12-31 18:10:23
1259
原创 springboot3如何集成knife4j 4.x版本及如何进行API注解
- knife4j是为**Java MVC框架集成Swagger生成Api文档的增强解决方案**, 取名knife4j是希望她能像一把匕首一样小巧,轻量,并且功能强悍!- 本文提供springboot3如何集成knife4j 4.x版本及如何进行API注解
2024-11-23 17:39:15
657
原创 深入理解 Spring Boot 的 WebApplicationType
在 Spring Boot 应用程序启动过程中,WebApplicationType 是一个重要的概念,它决定了应用程序是以 Web 应用程序的形式运行还是以非 Web 应用程序的形式运行。本文将详细探讨 WebApplicationType 的工作机制及其在实际项目中的应用。
2024-11-23 17:15:55
559
转载 Word模板引擎poi-tl(poi template language)使用入门指南
Word模板引擎poi-tl(poi template language)使用入门指南
2024-10-16 10:05:38
902
原创 如何使用PSTools工具集中的PSExec修改注册表信息,解决某些注册表项无法删除的问题
如何使用PSTools工具集中的PSExec修改注册表信息,解决某些注册表项无法删除的问题
2024-10-08 19:40:49
764
原创 FastAPI--如何自定义Docs UI,包括多个APP、静态资源、元数据等
FastAPI--如何自定义Docs UI,包括多个APP、静态资源、元数据等
2024-09-17 13:19:54
643
原创 如何构建一个提供nlp服务的镜像
本文介绍如何构建一个提供nlp服务的镜像,功能如下:基于hanlp 2.x、jionlp的基础采用fastapi封装NLP的相关服务
2024-09-04 18:18:12
564
原创 Alembic:python中数据库迁移的瑞士军刀
Alembic 是由 SQLAlchemy 的创始人 Mike Bayer 设计的一个数据库迁移工具。它不仅支持自动迁移脚本生成,还允许开发者手动编辑迁移脚本来满足特定的需求。Alembic 通过提供一个环境来跟踪数据库模式的变更历史,确保数据库的版本与应用代码保持同步。
2024-08-22 21:55:01
1360
原创 hg transformers pipeline使用
在Hugging Face的transformers库中,pipeline是一个高级API,它提供了一种简便的方式来使用预训练模型进行各种NLP任务,比如情感分析、文本生成、翻译、问答等。通过pipeline,你可以在几行代码内实现复杂的NLP任务。pipeline会自动加载用于指定任务的默认模型和tokenizer,如果需要,用户也可以指定使用特定的模型和tokenizer在创建pipeline时,除了可以指定任务类型和模型外,还可以设置其他参数,详见本文
2024-08-17 18:33:06
795
原创 深入理解Bouncy Castle:Java开发者的强大密码学工具箱
Bouncy Castle由澳大利亚的两位开发者于1998年创建,旨在为Java和C#平台提供强大的密码学功能。它不仅支持广泛的加密算法,还提供了对许多安全协议的支持,包括SSL/TLS、S/MIME、CMS、OCSP等。Bouncy Castle的库遵循JCE(Java Cryptography Extension)和JSSE(Java Secure Socket Extension)规范,同时它也扩展了这些规范,增加了更多的功能和灵活性。
2024-08-10 14:46:58
314
原创 poetry使用经验汇总
Poetry 是一个 Python 依赖管理和打包工具,它旨在解决 Python 项目中常见的依赖问题,提供更简洁、更可靠的依赖管理方式本文针对poetry的使用经验进行汇总
2024-07-06 22:29:45
908
原创 SecGPT 全球首个网络安全开源大模型且可以在CPU上运行的网络安全大模型
SecGPT 网络安全大模型探索使用网络安全知识训练大模型,能达到怎样的能力边界。SecGPT的愿景是将人工智能技术引入网络安全领域,以提高网络防御的效率和效果。其使命是推动网络安全智能化,为社会提供更安全的数字生活环境。SecGPT可以作为基座安全模型,用于探索各种网络安全任务。以下是对SecGPT在网络安全任务中可能应用的进一步探讨
2024-05-02 10:44:36
1618
3
原创 ASCII码表、ANSI、ANSI escape code、CSI、Unicode、UTF-8、UTF-16、UTF-32的相关知识,用于自查
ASCII码表、ANSI、ANSI escape code、CSI、Unicode、UTF-8、UTF-16、UTF-32的相关知识,用于自查
2024-05-01 09:44:18
168
原创 Jupyter 容器环境: Debian 11离线部署SSH Server总结
在基于continuumio/anaconda3镜像搭建的jupyter环境中,想在pycharm中进行远程debug代码,但容器中没有部署ssh server导致无法进行。本文讲述如何在anaconda3容器中安装ssh server
2024-04-30 21:07:39
807
1
原创 LLM--RAG中的文本切分策略及长上下文窗口是否会取代RAG?
在使用基于检索的生成模型(RAG)处理长文本数据时,合理的文本切割策略是提高模型性能和效率的关键。本文讲解文本切割相关的概念及技术要点。目前LLM模型进化的方向是增加上下文窗口的长度,主流LLM支持的上下文窗口长度越来越大,并且随着Infini-Transformer架构的出现,那么长上下文窗口是否会取代RAG?
2024-04-14 15:05:56
3560
原创 LLM-大模型演化分支树、GPT派发展阶段及训练流程图、Infini-Transformer说明
LLM-大模型演化分支树、GPT派发展阶段及训练流程图、Infini-Transformer说明
2024-04-14 11:22:56
1681
原创 快速了解FastAPI与Uvicorn是什么?
FastAPI is a modern, fast (high-performance), web framework for building APIs with Python 3.8+ based on standard Python type hints.本文带你快速了解FastAPI与Uvicorn是什么?
2024-04-06 22:23:25
2497
原创 clickhouse MPPDB数据库--新特性使用示例
从clickhouse 22.3至最新的版本24.3.2.23,clickhouse在快速发展中,每个版本都增加了一些新的特性,在数据写入、查询方面都有性能加速。本文根据[clickhouse blog](https://clickhouse.com/blog)中的clickhouse release blog中,学习并梳理了一些在实际工作中可能用到的新特性。
2024-04-04 14:08:35
1264
原创 docker容器添加新端口映射的步骤及`wsl$`目录的作用
docker容器如何添加新的端口映射在windows的Docker desktop中,`wsl$` 目录的作用是什么?
2024-04-01 20:35:25
615
原创 LLM-在CPU环境下如何运行ChatGLM-6B
ChatGLM-6B-INT4 是 ChatGLM-6B 量化后的模型权重。具体的,ChatGLM-6B-INT4 对 ChatGLM-6B 中的 28 个 GLM Block 进行了 INT4 量化,没有对 Embedding 和 LM Head 进行量化。量化后的模型理论上 6G 显存(使用 CPU 即内存)即可推理,具有在嵌入式设备(如树莓派)上运行的可能。在 CPU 上运行时,会根据硬件自动编译 CPU Kernel ,请确保已安装 GCC 和 OpenMP (Linux一般已安装,对于Wind
2024-03-31 14:54:29
619
原创 LLM--使用Milvus向量数据库必须知道的基本概念
Milvus 是一款专为大规模向量相似度搜索而设计的开源向量数据库。它旨在高效、快速地处理高维向量数据,并支持实时、近似最近邻(Approximate Nearest Neighbor, ANN)检索,适用于各种涉及向量搜索的应用场景,如图像识别、语音识别、推荐系统、自然语言处理(NLP)等。本文介绍使用Milvus作为向量数据库时必须知道的基本概念
2024-03-31 10:01:16
665
原创 LLM--如何使用SentenceTransformer将文本向量化
将文本向量化是自然语言处理(NLP)中的一项关键步骤,其主要目的是将原本难以直接被计算机理解的自然语言文本转换成数值形式的向量,以便于后续的机器学习算法和深度学习模型进行处理、分析和建模本文介绍如何使用SentenceTransformer将文本向量化
2024-03-31 09:41:57
1278
原创 LLM--提示词Propmt的概念、作用及如何设计提示词
一种用于`指导`人工智能(如聊天机器人或图像生成工具)`生成特定内容`的文字。**提示词**的设计旨在以一种`高效`、`精确`的方式向模型传达用户的`意图`或所需的`任务类型`,从而使模型想你所想。有关如何写好提示词,请学习[面向开发者的大模型手册 - LLM Cookbook](https://github.com/datawhalechina/llm-cookbook),设计高效 Prompt 的两个关键原则:**编写清晰、具体的指令**和**给予模型充足思考时间**
2024-03-31 08:41:25
6346
原创 Milvus 向量数据库:如何基于docker-compose在本地快速搭建测试环境
Milvus 向量数据库:如何基于docker-compose在本地快速搭建测试环境
2024-03-23 11:46:32
562
原创 Ollama 在本地快速启动并执行LLM【大语言模型】
Ollama 让你快速的在本地部署、启动并执行大语言模型Ollama makes it easy to get up and running with large language models locally.Get up and running with Llama 2, Mistral, Gemma, and other large language models.
2024-03-19 21:06:48
2561
CSOP 2023北京站-PPT
2023-06-05
HBase在搜索网页库上的应用_360.pdf
2013-07-28
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人