胖墩会武术-CSDN博客

原创【TensorRT C++ API模型加速】TensorRT环境配置、模型转换、CUDA C++加速、TensorRT C++ 加速

TensorRT（Tensor Runtime，TRT）：由 NVIDIA 开发，专为 NVIDIA GPU 设计的，用于深度学习高性能推理的SDK （software development kit ，软件开发工具包），可为推理应用程序提供低延迟和高吞吐量。

2024-12-17 20:09:49 2620

原创【Python/C API】使用C/C++调用Python

Python/C API：是 Python 提供的 C 语言的 API 库。实现在 C/C++ 中嵌入 Python 代码，包括C/C++ 调用 Python 函数、C/C++ 操作 Python 对象、双向通信等等。

2024-12-16 21:52:45 3646 1

原创【Git版本控制】配置 + 下载 + 上传 + 查看 + 添加 + 提交 + 拉取 + 推送 + 撤回

Git配置文件.gitignore用于指定Git应忽略的文件和目录，不纳入版本控制。其核心作用包括排除临时文件、保护敏感信息、减少仓库体积和保持提交历史清晰。工作原理是Git读取项目中的.gitignore文件规则，在git add时自动排除匹配文件。注意事项：文件需提交到仓库，已提交文件需先移除才能忽略，支持多级目录配置和全局规则。 Git命令行操作五步法：1) git init初始化（首次）；2) git add添加文件；3) git commit提交修改；4) git push首次推送；5) 后续直接

2023-11-20 10:47:54 2412

原创 PyQt6新手教程（七万字）

PyQt是Python编程语言的一个GUI（图形用户界面）工具包，它允许开发人员使用Python语言创建桌面应用程序。PyQt是基于Qt库的Python封装，Qt是一个流行的C++框架，用于开发跨平台的应用程序。

2023-11-01 11:31:35 53880 18

原创深入浅出：Python内存管理机制

python采用自动内存管理机制：又叫垃圾回收器(garbage collector，gc)。负责定期地扫描并自动回收不再使用的内存和对象，使得开发者可以专注于程序逻辑，而不必担心内存管理问题。

2023-10-23 09:47:31 5833 3

原创多线程与多进程（原理详解 + 函数详解 + 项目实战 + 经验分享）

进程是操作系统中的一个执行单元；多进程是同时运行多个进程的机制；线程是进程中的一个执行单元；多线程是在一个进程中同时运行多个线程；

2023-09-27 08:18:46 3006 1

原创【Conda虚拟环境】新建 + 激活 + 安装 + 查看 + 退出 + 删除 + 复制 + 导出 + 导入 + 更改

（1）创建虚拟环境（2）激活虚拟环境（4）查看虚拟环境（3）退出虚拟环境（5）删除虚拟环境（6）复制虚拟环境（7）导出虚拟环境（8）导入虚拟环境（9）更改虚拟环境的安装路径（10）在指定路径下，配置虚拟环境

2023-08-16 09:47:12 42617 8

原创 Opencv C++图像处理（全）

备注：以下源码均可运行，不同项目涉及的函数均有详细分析说明。

2023-04-29 00:04:15 11580 2

原创 yolov7目标检测：基于自定义数据集完成检测、训练、测试

主要分三步：（1）环境配置与文件配置（2）检测（3）训练。其中，检测和训练都是可以独立进行的。检测是依赖于权重文件即可运行，而训练是基于自定义训练数据集和超参数生成权重文件。

2023-03-25 20:39:11 6862 13

原创【深度学习环境配置】Anaconda + PyCharm + CUDA + cuDNN + PyTorch + OpenCV

（1）【CPU版本】Anaconda（Python） + Pycharm + Pytorch（CPU） + Opencv（2）【GPU版本】Anaconda（Python） + Pycharm + CUDA + cuDNN + Pytorch（GPU） + Opencv

2023-02-23 02:00:00 25108 4

原创 Python常用内置函数（全）

详解Python常用函数，并深度剖析彼此的联系。共包括五个大类：数据类型、数据结构、高阶函数、通用函数、数学函数。

2023-01-15 20:38:39 14501 2

原创三万字硬核详解：yolov1、yolov2、yolov3、yolov4、yolov5、yolov7

Yolo (You Only Look Once) 是目标检测 one-state 的神经网络模型，可以在图像中找出特定物体, 并识别种类和位置。

2023-01-08 00:57:12 28991 11

原创六万字硬核详解：卷积神经网络CNN（原理详解 + 项目实战 + 经验分享）

深入解析卷积神经网络（CNN）的实际应用，全面整理并梳理了CNN的关键知识点。从基础概念到实战技巧，加速理解与实战，并解决实际问题。

2022-10-31 07:57:08 63525 38

原创【PyTorch基础】数据处理工具箱 + 神经网络工具箱 + Tensor基础 + Numpy基础

详细介绍Pytorch的数据处理工具箱、神经网络工具箱、Tensor基础、Numpy基础。PyTorch 是一个由 Facebook 团队于 2017 年发布的深度学习框架，是 Torch 框架在 Python 上的衍生。

2022-10-25 01:35:37 6344 9

原创 OpenCV图像处理（全）

备注：以下源码均可运行，不同项目涉及的函数均有详细分析说明。

2022-08-30 22:40:07 85251 74

原创 AI 编程工具的三次范式跃迁：代码级生成、文件级协作、项目级认知

本文系统梳理了 AI 编程工具从 2021 年至今的关键演进路径：从 Copilot 验证代码生成可行性，到 Cursor 重构编辑器交互范式，再到 DeepSeek 与 Trae 推动能力普惠化。文章进一步指出，当前阶段的核心分水岭已不在模型本身，而在于是否具备项目级理解与长期上下文记忆能力，这也是国内外 AI 编程工具形成阶段性差距的关键所在。

2025-12-31 10:20:06 883

原创 FastAPI从入门到实战：打造高性能图像处理Web应用

FastAPI是一个基于Python的高性能Web框架，以其快速、易用和自动生成API文档等特点广受欢迎。本文介绍了FastAPI的基本使用，包括环境配置、创建Hello World应用、运行服务器以及自动生成的交互式API文档。通过示例代码演示了路径参数、查询参数和请求体的处理方式，展示了FastAPI结合Pydantic进行数据验证的能力。该框架特别适合需要快速开发RESTful API的场景，其自动类型检查和文档生成功能极大提升了开发效率。

2025-12-18 16:36:38 908

原创【PyTorch项目实战】Ultralytics YOLO模型本地部署（训练 + 测试 + 推理）

YOLO（You Only Look Once）是Ultralytics推出的实时目标检测生态系统，支持检测、分割、分类、姿态估计和跟踪等任务。新一代YOLOE模型统一了多种视觉任务，具有实时性、多任务处理能力和视觉提示增强功能。其核心架构包含特征提取、融合和任务解码模块，提供不同规模的模型选择。YOLOE支持文本、视觉提示和内置词汇表三种交互方式，其中视觉提示分割(VPSeg)通过框选或掩码引导模型关注特定区域。模型特点包括自动下载预训练权重、多平台部署支持，但对不封闭目标和未训练数据表现有限。Ultra

2025-12-10 10:31:10 969

原创【PyTorch项目实战】SAM3：概念分割 + 3D重建（模型 + 人体）

SAM 3是Meta推出的新一代通用图像分割模型，相比前代SAM/SAM2在性能上有显著提升。核心创新包括提示式概念分割（PCS）任务、解耦识别架构、多模态提示融合等。支持图像分割、视频跟踪、开放词汇识别等功能，推理速度更快（A100上<200ms）。新增400万条概念标签数据，扩展了开放词汇理解能力。应用场景涵盖图像/视频标注、多目标跟踪等，但3D重建精度仍有提升空间。

2025-11-30 12:07:10 1244 8

原创【PyTorch项目实战】Swin-Unet：用于医学图像分割的类Unet纯Transformer模型

摘要本文介绍了Swin-Unet，一种基于纯Transformer架构的医学图像分割模型。Swin-Unet通过将Swin Transformer与U-Net结构相结合，构建了首个完全摒弃卷积的U型分割网络。该方法利用移位窗口自注意力机制(SW-MSA)实现全局上下文建模，同时通过层次化特征提取和多尺度融合保留局部细节。实验表明，Swin-Unet在医学图像分割任务中超越了传统CNN方法，标志着从卷积主导到Transformer驱动的技术过渡。文章还梳理了医学分割技术的发展历程，从早期CNN模型、Tran

2025-11-19 14:07:08 1129

原创【OpenCV图像处理】深度学习：cv2.dnn() —— 图像分类、人脸检测、目标检测

OpenCV DNN模块提供高效的深度学习推理能力，支持加载多种框架的预训练模型（Caffe/TensorFlow/ONNX/YOLO等），无需依赖完整深度学习框架。其核心优势包括轻量级部署、多硬件支持（CPU/GPU）和丰富的计算机视觉任务应用（分类/检测/分割等）。典型使用流程为：加载模型→预处理输入→前向传播→解析输出。以GoogleNet图像分类为例，需下载.prototxt网络结构、.caffemodel权重及类别标签，通过cv2.dnn.readNetFromCaffe()加载模型，blobFr

2025-11-17 11:08:40 1051 2

原创【OpenCV图像处理】级联分类器：cv2.CascadeClassifier() —— 目标检测（猫脸/人脸/眼睛/微笑/全身/车牌）

Haar 级联分类器（Haar Cascade Classifier）：是 OpenCV 中一种基于 Haar 特征和 AdaBoost 分类算法的物体检测方法，广泛应用于人脸、眼睛、行人等物体的检测。

2025-11-14 10:15:24 689

原创【OpenCV图像处理】图像去噪：cv2.fastNlMeansDenoising()

cv2.fastNlMeansDenoising() 是一种基于非局部均值去噪（Non-Local Means, NLM）的方法，旨在去除图像中的噪声。其核心思想是在图像的局部区域内，通过计算相似性并加权平均周围像素的值来减少噪声，同时保持图像的细节和边缘。

2025-11-13 16:21:48 977

原创【OpenCV图像处理】模板匹配：cv2.matchTemplate() —— 具有尺度与旋转不变性（开发）

本文摘要：针对高分辨率模板与低分辨率原图的尺寸不变匹配需求，提出两种解决方案：(1)单尺度手动缩放匹配，通过预定义缩放因子调整模板尺寸；(2)多尺度金字塔自动搜索，在0.1-1.0范围内迭代寻找最优匹配。两种方法均采用OpenCV的模板匹配算法(TM_CCOEFF_NORMED)，其中自动方法能适应未知缩放比例，输出最佳匹配位置、分数及缩放系数。实验结果表明，该方法有效解决了传统模板匹配对尺寸敏感的痛点，适用于不同分辨率但相同尺寸的医学/工业图像匹配场景。

2025-11-10 18:16:26 1054

原创【OpenCV图像处理】特征点匹配：cv2.BFMatcher() + cv2.FlannBasedMatcher() —— 多目标检测（开发）

本文介绍了图像特征点匹配技术的关键概念与应用。特征点匹配通过提取图像关键点（SIFT、ORB等算法）并计算特征描述子，实现不同图像间的特征对应。文章详细分析了特征点匹配的优缺点：具有尺度、旋转、光照不变性等优势，但存在计算复杂度高、纹理依赖性强、大视角变化敏感等局限。同时提供了完整的算法流程（检测→描述→匹配→筛选→可视化）和OpenCV相关函数分类表，包括12种特征检测器和6种特征描述子实现方法。文章指出该技术适用于图像拼接、三维重建等场景，但在实时应用或低纹理环境中需谨慎使用，建议结合其他技术弥补不足。

2025-11-07 18:30:57 1310 2

原创【图像增强】去条纹 + 去暗角 + 去模糊 + 去噪 + 超分

本文总结了四种图像处理算法：图像去模糊采用反卷积RL算法，通过迭代更新图像估计值；去条纹使用FFT频域滤波方法，适用于自然图像与荧光图像；去暗角算法用于消除图像边缘暗区；去噪算法提供了五种方法，包括计算复杂度、边缘保留性及适用场景的对比，重点介绍了自适应方向保持去噪算法，该算法结合结构张量与方向性高斯加权滤波，能有效保留SEM图像中的纤维状微结构。

2025-11-04 16:04:40 921

原创坐标系旋转（四元数 + 欧拉角 + 轴角表示 +旋转矩阵）

在三维空间中，旋转可以通过多种方式表示，其中最常见的包括欧拉角、旋转角-轴表示法（旋转角）和四元数。它们各自有不同的应用场景和优缺点。

2025-10-22 18:09:47 1194

原创 Streamlit是什么？

Streamlit是一个开源Python框架，可快速将数据分析脚本转换为交互式Web应用，无需前端知识。其特点包括简单易用、实时更新、丰富组件（文本、输入控件、图表等）和快速部署。通过pip安装后，只需几行代码即可创建基本应用，如输入框和按钮交互。运行后自动生成本地Web界面，修改代码实时刷新，适合数据可视化展示。

2025-10-10 16:06:14 890

原创 Hugging Face使用指南

本文介绍了大模型训练的完整流程，包括预训练、微调和后训练三个阶段。预训练阶段利用大规模无标注数据建立基础语言理解能力，微调阶段使用标注数据适配具体任务，后训练阶段通过SFT、RLHF等方法提升模型对齐能力和实用性。文章还详细介绍了Hugging Face生态系统及其核心组件，特别是accelerate框架如何简化分布式训练。最后提供了模型加载的API总览，涵盖从基本加载到高级配置的多种方法。整个训练流程需要大量计算资源和时间，但通过Hugging Face等工具可以显著提高效率。

2025-09-28 10:03:33 1212

原创大模型效果优化方案（经验分享）

本文以2025国际大数据竞赛为例，探讨了拍照识题与解题的技术方案。比赛要求通过手机拍摄的数学题目照片进行自动解题，涉及小学至大学不同难度的选择题、填空题等题型。文章重点分析了OCR+LLM和多模态大模型两种技术路线的优劣，并针对数据稀缺、题型多样、图文混排等挑战，提出了包括数据增强、多模态融合、模型优化等解决方案。特别推荐Qwen2.5-VL-3B-Instruct多模态模型，通过视觉-语言联合训练提升复杂数学题的识别和推理能力。最后总结了不同技术方案的特点和适用场景，为类似数学题目识别与自动解题任务提供了

2025-09-25 15:58:03 1117

空空如也

空空如也