- 博客(508)
- 资源 (23)
- 问答 (2)
- 收藏
- 关注
原创 使用Unsloth微调DeepSeek-R1蒸馏模型:低显存高效训练实践
在当前大语言模型快速发展的背景下,如何在有限硬件资源下对高性能模型(如 DeepSeek-R1)进行高效微调成为关键技能。本文以Unsloth为工具,一步步完成从环境搭建、模型加载、LoRA 配置、数据集处理、模型训练与推理,到最后模型保存与合并的完整流程。
2025-05-06 22:49:01
608
原创 n8n入门指南:强大的自动化工作流工具
n8n是一个开源、强大的工作流自动化工具,允许用户通过可视化方式连接不同的应用程序和服务。它将AI功能与业务流程自动化相结合,它可以帮助开发者和非技术人员创建复杂的工作流,实现数据在不同系统间的自动传输和处理。
2025-05-06 15:18:40
419
原创 browser-use:AI驱动的浏览器自动化工具使用指南
browser-use是一个基于 Python 的开源库,旨在简化 AI 代理与浏览器之间的交互。它将先进的AI功能与强大的浏览器自动化功能相结合,通过集成Playwright工具,让AI模型自动化操作浏览器,实现网页浏览、信息提取和用户操作模拟,从而让AI代理能够无缝进行网络交互。
2025-04-25 21:06:55
876
原创 Qdrant向量数据库入门指南
Qdrant是一个开源的向量相似度搜索引擎,它提供了一个生产就绪的服务,通过便捷的API来存储、搜索和管理带有额外有效载荷的向量。
2025-04-25 09:00:00
767
原创 一文读懂主流开源协议:附详细ASCII图表对比
开源协议种类繁多,如何选择适合自己项目的协议?本文通过清晰的 ASCII 图表,对比 MIT、GPL、Apache 等主流开源协议的核心区别,包括是否允许商用、修改、闭源等关键点。无论你是开发者、企业还是开源爱好者,都能快速找到最适合的协议。附详细描述与实用建议,助你轻松搞定开源协议选型!🚀
2025-04-10 21:43:44
708
原创 Docker数据卷(Volume)与宿主机目录挂载(Bind Mount)深度对比
在 Docker 容器化部署中,数据持久化是核心需求之一。Docker 提供了两种主要的数据挂载方式:数据卷(Volume)和宿主机目录挂载(Bind Mount)。
2025-04-10 09:00:00
1654
原创 MCP入门指南:让AI模型与外部世界无缝连接
MCP(模型上下文协议)是一个革命性的开放协议,它让AI模型能够安全地访问外部资源。通过统一的标准,几乎所有市场上的大型模型都可以连接到MCP,实现与数据源和工具的无缝集成,为构建复杂智能体和工作流提供了坚实基础。
2025-03-27 16:19:31
1226
原创 构建智能天气助手:基于大模型API与工具函数的调用实践
在人工智能快速发展的今天,大语言模型(LLM)已经成为构建智能应用的重要基础设施。本文将介绍如何利用大模型API和工具函数集成,构建一个能够理解自然语言并提供精准天气信息的智能助手。
2025-03-27 09:00:00
1042
原创 使用vLLM部署DeepSeek-R1-Distill-Qwen-7B模型:从环境配置到高效推理
本文将详细介绍如何使用 vLLM 框架部署DeepSeek-R1-Distill-Qwen-7B模型,并完成高效的推理任务。将从环境配置、模型加载、推理优化等方面一步步展开,帮助快速上手vLLM并体验其强大的性能优势。无论是深度学习开发者还是对大模型推理感兴趣的研究者,本文都能提供实用的指导。
2025-03-01 16:48:11
1775
原创 优化解决Windows的Linux子系统WSL中的虚拟硬盘文件VHDX空间占用问题
在Windows上使用Linux 子系统 (WSL) 时,可能会遇到虚拟硬盘文件 (VHDX) 占用大量磁盘空间的问题,即使已经删除了其中的文件。
2025-03-01 14:41:03
484
原创 破解Docker镜像拉取难题:为Docker配置代理加速镜像拉取
本文深入讲解Docker代理配置的核心方法,涵盖daemon.json与Systemd环境变量两种方案,助你快速解决跨国镜像拉取、私有仓库访问等难题。
2025-02-20 09:40:26
583
原创 从源代码编译构建vLLM并解决常见编译问题
本文详细记录了从源代码构建 vLLM 的完整过程,重点解决了编译过程中可能遇到的错误,并针对常见的编译错误提供了解决方案。
2025-02-13 09:49:39
1236
原创 解决 WSL 2 中 Ubuntu 22.04 安装 Docker 后无法启动的问题
Docker的网络功能(如端口映射、网络隔离)依赖于传统的iptables规则。虽然iptables-nft提供了兼容层,但在某些情况下,Docker可能无法正确解析或应用这些规则,导致网络初始化失败。
2025-01-18 22:29:07
1917
2
原创 知识库助手的构建之路:ChatGLM3-6B和LangChain的深度应用
本文将探讨如何利用ChatGLM3-6B和LangChain构建高效的知识库助手。将涵盖从下载大模型和向量模型、自定义LLM 类,到文件读取与处理、构建向量数据库的全过程。最后,实现检索问答链并进行系统测试。
2024-11-28 17:21:31
666
原创 LangChain之检索增强生成RAG
RAG全称为Retrieval-Augmented Generation,即检索增强生成,结合了检索和生成的能力,引入外部知识库为文本生成任务提供支持,增强模型生成能力,产生更丰富、准确、有根据的内容。
2024-11-28 14:26:18
935
原创 Python办公自动化:用xlwt、openpyxl、xlutils等库轻松写入Excel数据
xlwt、openpyxl、xlutils是三种流行的Python库,它们可以高效地写入Excel数据,每个库都有其独特的功能和适用场景。
2024-11-26 16:05:02
749
原创 Python办公自动化:用xlrd轻松读取Excel文件
xlrd是一个用于读取Excel文件的Python库,它可以帮助用户快速提取数据并进行分析。它适合用于读取旧版Excel 文件(.xls 格式)中的数据,对于新格式的Excel文件,推荐使用其他库如openpyxl或pandas。
2024-11-26 10:00:19
1368
原创 Python之time时间库
time是Python标准库中的一个模块,用于处理时间相关的操作。它提供了各种函数来获取当前时间、格式化时间、进行时间的转换和计算等。
2024-11-21 22:31:29
1687
原创 轻松上手Nginx Proxy Manager:安装、配置与实战
Nginx Proxy Manager是一个基于Nginx的反向代理管理工具,旨在简化Nginx的配置和管理。它提供了一个直观的Web界面,使用户可以轻松地设置和管理反向代理、SSL证书、访问控制等功能。
2024-11-21 16:26:35
3518
原创 文件夹、文件目录递归下载:打包成ZIP压缩包
在Java中如果要实现文件夹、文件目录的递归下载并打包成ZIP压缩包,可以通过遍历文件夹、创建ZIP输出流、将文件添加到ZIP等操作实现。
2024-10-28 10:44:15
476
原创 Django之Haystack对接搜索引擎框架Elasticsearch
Haystack是在Django中对接搜索引擎的框架,搭建用户和搜索引擎之间的沟通桥梁。它提供了一种简化的方式来集成不同的搜索引擎,如Elasticsearch、Whoosh、Solr等。
2024-09-25 15:37:57
1229
原创 轻松掌握APScheduler:一个Python定时任务调度利器
APScheduler是一个轻量级的Python调度库,用于安排和管理任务的执行。APScheduler广泛应用于周期性任务的调度,如数据备份、数据清理、定时发送邮件等。
2024-09-25 09:19:36
1900
原创 Unborn安装CUDA Toolkit 12.2
OSError: CUDA_HOME environment variable is not set. Please set it to your CUDA install root.
2024-09-20 21:44:14
742
原创 Apache Dolphinscheduler:一个开源的分布式工作流调度系统
Apache DolphinScheduler 是一个开源的分布式工作流调度系统,主要用于数据处理和任务调度。它支持多种数据源和任务类型,能够帮助用户在大数据环境中进行复杂的工作流管理。
2024-09-20 10:38:55
1750
原创 基于基础模型BERT与大语言模型ChatGLM3-6B实现文本分类、信息抽取、文本匹配等任务
在实现文本分类、信息抽取、文本匹配等任务时,可以采用两种主要的方法。1.基于基础模型进行微调训练,以适应特定任务的需求。2.基于大模型(预训练语言模型)进行任务实现。
2024-09-13 21:07:37
1525
原创 Xorbits Inference(Xinference):一款性能强大且功能全面的大模型部署与分布式推理框架
Xinference是一个性能强大且功能全面的分布式推理框架。可用于大语言模型,语音识别模型,多模态模型等各种模型的推理。通过Xinference,你可以轻松地一键部署你自己的模型或内置的前沿开源模型。
2024-09-13 09:00:00
3680
2
原创 SpringDoc:一个用于自动生成API文档的工具
SpringDoc是一个用于Spring Boot的库,可以帮助生成OpenAPI规范的文档,简化API的文档化过程。它支持Swagger UI的集成,使得用户可以直观地查看和测试API端点。
2024-08-07 17:06:19
5853
2
原创 python-dotenv库
python-dotenv是一个简单的Python库,可以帮助开发者在开发和生产环境中轻松地加载环境变量。这样可以方便地在项目中管理敏感信息或其他配置,尤其是在不同的环境(开发、测试、生产)中。
2024-08-07 14:37:38
749
原创 Rich:一个用于在Python控制台中生成美观和丰富输出的库
Rich库为Python提供了丰富的控制台输出功能,支持打印文本、文本格式化、面板、进度条、树形结构和实时更新等多种使用场景。通过这些功能,可以创建更加美观和交互性强的控制台应用程序。
2024-08-06 20:44:10
1384
原创 LangChain之网络爬虫
LangChain的网络爬虫功能通过集成工具简化了网页数据的自动抓取和文本转换,支持异步加载和多种HTML到文本的转换方法,为自动化网络研究提供了强大支持。
2024-08-06 10:24:04
798
转载 Spring Boot项目整合Retrofit:优雅的HTTP客户端工具
retrofit-spring-boot-starter 是一个由 LianjiaTech 开发的 Spring Boot 启动器,旨在简化 Retrofit 的集成与使用。Retrofit 是一个强大的类型安全的 HTTP 客户端,广泛用于 Android 和 Java 应用程序,特别适合与 RESTful API 进行交互。
2024-08-01 16:40:30
846
原创 LangChain之借助Apify云平台实现网站内容爬取与回答问题
LangChain之借助网络抓取和数据提取的云平台Apify,实现深度爬取网站内容,同时提取文本内容进行向量存储,并回答相应的问题。
2024-07-31 15:30:56
673
原创 LangChain之提取解析与结构化输出
从原始LLM生成结构化输出可能是非常困难的,尤其在需要特定格式时。但是LLM只需适当说明和示例,就可以快速适应提取任务。
2024-07-31 11:19:05
1235
1
原创 LangChain之数据库操作:通过链Chain和代理Agent查询数据库信息
在LangChain,其提供了SQL Chain链和SQL Agent代理,他们支持基于自然语言提示构建和运行SQL查询,以此来操作数据库,并且与SQLAlchemy支持的任何SQL版本兼容
2024-07-24 16:53:11
2672
2
原创 Logback日志框架之使用MDC动态变量根据业务、接口、任务生成相应日志文件
在Logback日志框架中,使用MDC可以为每个线程关联一些上下文信息,在日志输出时可以包含这些信息,从而区分不同线程的日志输出。
2024-07-24 14:04:03
1685
原创 LangChain工具箱Toolkits之使用Gmail工具箱实现邮件查询、邮件发送、邮件删除等操作
LangChain提供了一系列的工具箱Toolkits,它们专门针对某些任务而设计,拥有方便的加载方法。这些Toolkits可以帮助我们更高效地执行特定任务。
2024-07-23 17:18:10
2147
原创 LangChain工具箱Toolkits之使用PlayWright Browser工具自动化Web操作
LangChain提供了一系列的工具箱Toolkits,它们专门针对某些任务而设计,拥有方便的加载方法。这些Toolkits 可以帮助我们更高效地执行特定任务。
2024-07-12 17:29:39
1501
原创 LangChain之工具Tools(下)
在LangChain中,通常代理根据任务类型和需求通过大模型推理选择工具处理任务,LangChain传递任务输入给工具生成输出,输出再经大模型推理,作为其他工具输入或最终结果返回给用户。
2024-07-12 13:33:53
1496
原创 LangChain之工具Tools(上)
在LangChain中,通常代理根据任务类型和需求通过大模型推理选择工具处理任务,LangChain传递任务输入给工具生成输出,输出再经大模型推理,作为其他工具输入或最终结果返回给用户。
2024-07-10 20:36:55
4474
原创 使用PEFT库进行ChatGLM3-6B模型的QLORA高效微调
QLoRA是LoRA的扩展版本,在微调过程中引入了量化技术,以进一步提高参数效率。QLoRA利用LoRA的原理,并引入了4位NormalFloat(NF4)量化和双重量化技术,进一步减少了存储和计算资源的使用。
2024-07-10 17:13:41
1394
TCPView:实时监控和管理系统TCP/UDP网络连接
2025-04-18
finalshell-4.3.10-windows-x64.exe:一个SSH客户端工具
2024-10-29
WizTree:一款免费的Windows磁盘分析工具
2024-08-15
HeidiSQL:一款数据库管理工具
2024-08-02
jdk-8u141-linux-x614.tar.gz
2024-08-01
Bulk Rename Utility:一个可以自定义规则批量重命名文件的工具
2024-07-17
FastStone Capture 10.6:一个功能强大的录屏、截图工具
2024-07-17
适用于window的apache-maven-3.5.x~3.9.x-bin.zip安装程序
2024-06-26
Fiddler安装包与菜单汉化
2024-02-20
VMware ESXI 8.0镜像安装包
2024-02-20
Java开发手册(嵩山版).pdf
2023-06-28
Java开发手册(泰山版).pdf
2023-06-28
flink安装程序,具体版本flink-1.7.0-bin-scala-2.12
2023-06-28
Apache OpenOffice开源办公软件套件
2023-05-16
LibreOffice开源办公套件
2023-05-16
Bandicam屏幕录制软件
2023-05-06
磁盘空间使用情况分析工具之WizTree
2023-05-06
mysql-5.7.27-1.el7.x86-64.rpm
2023-04-27
skywalking-apm+skywalking-java-agent
2023-04-26
Protocol Buffers - Google的数据交换格式
2023-04-21
Vue.js 核心 相关面试题
2023-02-13
Postman-9.16.0
2022-07-27
apache-tomcat-9.0.65-windows-x64.zip
2022-07-27
TA创建的收藏夹 TA关注的收藏夹
TA关注的人