自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(228)
  • 资源 (1)
  • 收藏
  • 关注

原创 【TensorRT C++ API模型加速】TensorRT环境配置、模型转换、CUDA C++加速、TensorRT C++ 加速

TensorRT(Tensor Runtime,TRT):由 NVIDIA 开发,专为 NVIDIA GPU 设计的,用于深度学习高性能推理的SDK (software development kit ,软件开发工具包),可为推理应用程序提供低延迟和高吞吐量。

2024-12-17 20:09:49 2620

原创 【Python/C API】使用C/C++调用Python

Python/C API:是 Python 提供的 C 语言的 API 库。实现在 C/C++ 中嵌入 Python 代码,包括C/C++ 调用 Python 函数、C/C++ 操作 Python 对象、双向通信等等。

2024-12-16 21:52:45 3646 1

原创 【Git版本控制】配置 + 下载 + 上传 + 查看 + 添加 + 提交 + 拉取 + 推送 + 撤回

Git配置文件.gitignore用于指定Git应忽略的文件和目录,不纳入版本控制。其核心作用包括排除临时文件、保护敏感信息、减少仓库体积和保持提交历史清晰。工作原理是Git读取项目中的.gitignore文件规则,在git add时自动排除匹配文件。注意事项:文件需提交到仓库,已提交文件需先移除才能忽略,支持多级目录配置和全局规则。 Git命令行操作五步法:1) git init初始化(首次);2) git add添加文件;3) git commit提交修改;4) git push首次推送;5) 后续直接

2023-11-20 10:47:54 2412

原创 PyQt6新手教程(七万字)

PyQt是Python编程语言的一个GUI(图形用户界面)工具包,它允许开发人员使用Python语言创建桌面应用程序。PyQt是基于Qt库的Python封装,Qt是一个流行的C++框架,用于开发跨平台的应用程序。

2023-11-01 11:31:35 53880 18

原创 深入浅出:Python内存管理机制

python采用自动内存管理机制:又叫垃圾回收器(garbage collector,gc)。负责定期地扫描并自动回收不再使用的内存和对象,使得开发者可以专注于程序逻辑,而不必担心内存管理问题。

2023-10-23 09:47:31 5833 3

原创 多线程与多进程(原理详解 + 函数详解 + 项目实战 + 经验分享)

进程是操作系统中的一个执行单元;多进程是同时运行多个进程的机制;线程是进程中的一个执行单元;多线程是在一个进程中同时运行多个线程;

2023-09-27 08:18:46 3006 1

原创 【Conda虚拟环境】新建 + 激活 + 安装 + 查看 + 退出 + 删除 + 复制 + 导出 + 导入 + 更改

(1)创建虚拟环境(2)激活虚拟环境(4)查看虚拟环境(3)退出虚拟环境(5)删除虚拟环境(6)复制虚拟环境(7)导出虚拟环境(8)导入虚拟环境(9)更改虚拟环境的安装路径(10)在指定路径下,配置虚拟环境

2023-08-16 09:47:12 42617 8

原创 Opencv C++图像处理(全)

备注:以下源码均可运行,不同项目涉及的函数均有详细分析说明。

2023-04-29 00:04:15 11580 2

原创 yolov7目标检测:基于自定义数据集完成检测、训练、测试

主要分三步:(1)环境配置与文件配置(2)检测(3)训练。其中,检测和训练都是可以独立进行的。检测是依赖于权重文件即可运行,而训练是基于自定义训练数据集和超参数生成权重文件。

2023-03-25 20:39:11 6862 13

原创 【深度学习环境配置】Anaconda + PyCharm + CUDA + cuDNN + PyTorch + OpenCV

(1)【CPU版本】Anaconda(Python) + Pycharm + Pytorch(CPU) + Opencv(2)【GPU版本】Anaconda(Python) + Pycharm + CUDA + cuDNN + Pytorch(GPU) + Opencv

2023-02-23 02:00:00 25108 4

原创 Python常用内置函数(全)

详解Python常用函数,并深度剖析彼此的联系。共包括五个大类:数据类型、数据结构、高阶函数、通用函数、数学函数。

2023-01-15 20:38:39 14501 2

原创 三万字硬核详解:yolov1、yolov2、yolov3、yolov4、yolov5、yolov7

Yolo (You Only Look Once) 是目标检测 one-state 的神经网络模型,可以在图像中找出特定物体, 并识别种类和位置。

2023-01-08 00:57:12 28991 11

原创 六万字硬核详解:卷积神经网络CNN(原理详解 + 项目实战 + 经验分享)

深入解析卷积神经网络(CNN)的实际应用,全面整理并梳理了CNN的关键知识点。从基础概念到实战技巧,加速理解与实战,并解决实际问题。

2022-10-31 07:57:08 63525 38

原创 【PyTorch基础】数据处理工具箱 + 神经网络工具箱 + Tensor基础 + Numpy基础

详细介绍Pytorch的数据处理工具箱、神经网络工具箱、Tensor基础、Numpy基础。PyTorch 是一个由 Facebook 团队于 2017 年发布的深度学习框架,是 Torch 框架在 Python 上的衍生。

2022-10-25 01:35:37 6344 9

原创 OpenCV图像处理(全)

备注:以下源码均可运行,不同项目涉及的函数均有详细分析说明。

2022-08-30 22:40:07 85251 74

原创 AI 编程工具的三次范式跃迁:代码级生成、文件级协作、项目级认知

本文系统梳理了 AI 编程工具从 2021 年至今的关键演进路径:从 Copilot 验证代码生成可行性,到 Cursor 重构编辑器交互范式,再到 DeepSeek 与 Trae 推动能力普惠化。文章进一步指出,当前阶段的核心分水岭已不在模型本身,而在于是否具备项目级理解与长期上下文记忆能力,这也是国内外 AI 编程工具形成阶段性差距的关键所在。

2025-12-31 10:20:06 883

原创 FastAPI从入门到实战:打造高性能图像处理Web应用

FastAPI是一个基于Python的高性能Web框架,以其快速、易用和自动生成API文档等特点广受欢迎。本文介绍了FastAPI的基本使用,包括环境配置、创建Hello World应用、运行服务器以及自动生成的交互式API文档。通过示例代码演示了路径参数、查询参数和请求体的处理方式,展示了FastAPI结合Pydantic进行数据验证的能力。该框架特别适合需要快速开发RESTful API的场景,其自动类型检查和文档生成功能极大提升了开发效率。

2025-12-18 16:36:38 908

原创 【PyTorch项目实战】Ultralytics YOLO模型本地部署(训练 + 测试 + 推理)

YOLO(You Only Look Once)是Ultralytics推出的实时目标检测生态系统,支持检测、分割、分类、姿态估计和跟踪等任务。新一代YOLOE模型统一了多种视觉任务,具有实时性、多任务处理能力和视觉提示增强功能。其核心架构包含特征提取、融合和任务解码模块,提供不同规模的模型选择。YOLOE支持文本、视觉提示和内置词汇表三种交互方式,其中视觉提示分割(VPSeg)通过框选或掩码引导模型关注特定区域。模型特点包括自动下载预训练权重、多平台部署支持,但对不封闭目标和未训练数据表现有限。Ultra

2025-12-10 10:31:10 969

原创 【PyTorch项目实战】SAM3:概念分割 + 3D重建(模型 + 人体)

SAM 3是Meta推出的新一代通用图像分割模型,相比前代SAM/SAM2在性能上有显著提升。核心创新包括提示式概念分割(PCS)任务、解耦识别架构、多模态提示融合等。支持图像分割、视频跟踪、开放词汇识别等功能,推理速度更快(A100上<200ms)。新增400万条概念标签数据,扩展了开放词汇理解能力。应用场景涵盖图像/视频标注、多目标跟踪等,但3D重建精度仍有提升空间。

2025-11-30 12:07:10 1244 8

原创 【PyTorch项目实战】Swin-Unet:用于医学图像分割的类Unet纯Transformer模型

摘要 本文介绍了Swin-Unet,一种基于纯Transformer架构的医学图像分割模型。Swin-Unet通过将Swin Transformer与U-Net结构相结合,构建了首个完全摒弃卷积的U型分割网络。该方法利用移位窗口自注意力机制(SW-MSA)实现全局上下文建模,同时通过层次化特征提取和多尺度融合保留局部细节。实验表明,Swin-Unet在医学图像分割任务中超越了传统CNN方法,标志着从卷积主导到Transformer驱动的技术过渡。文章还梳理了医学分割技术的发展历程,从早期CNN模型、Tran

2025-11-19 14:07:08 1129

原创 【OpenCV图像处理】深度学习:cv2.dnn() —— 图像分类、人脸检测、目标检测

OpenCV DNN模块提供高效的深度学习推理能力,支持加载多种框架的预训练模型(Caffe/TensorFlow/ONNX/YOLO等),无需依赖完整深度学习框架。其核心优势包括轻量级部署、多硬件支持(CPU/GPU)和丰富的计算机视觉任务应用(分类/检测/分割等)。典型使用流程为:加载模型→预处理输入→前向传播→解析输出。以GoogleNet图像分类为例,需下载.prototxt网络结构、.caffemodel权重及类别标签,通过cv2.dnn.readNetFromCaffe()加载模型,blobFr

2025-11-17 11:08:40 1051 2

原创 【OpenCV图像处理】级联分类器:cv2.CascadeClassifier() —— 目标检测(猫脸/人脸/眼睛/微笑/全身/车牌)

Haar 级联分类器(Haar Cascade Classifier):是 OpenCV 中一种基于 Haar 特征 和 AdaBoost 分类算法的物体检测方法,广泛应用于人脸、眼睛、行人等物体的检测。

2025-11-14 10:15:24 689

原创 【OpenCV图像处理】图像去噪:cv2.fastNlMeansDenoising()

cv2.fastNlMeansDenoising() 是一种基于非局部均值去噪(Non-Local Means, NLM)的方法,旨在去除图像中的噪声。其核心思想是在图像的局部区域内,通过计算相似性并加权平均周围像素的值来减少噪声,同时保持图像的细节和边缘。

2025-11-13 16:21:48 977

原创 【OpenCV图像处理】模板匹配:cv2.matchTemplate() —— 具有尺度与旋转不变性(开发)

本文摘要:针对高分辨率模板与低分辨率原图的尺寸不变匹配需求,提出两种解决方案:(1)单尺度手动缩放匹配,通过预定义缩放因子调整模板尺寸;(2)多尺度金字塔自动搜索,在0.1-1.0范围内迭代寻找最优匹配。两种方法均采用OpenCV的模板匹配算法(TM_CCOEFF_NORMED),其中自动方法能适应未知缩放比例,输出最佳匹配位置、分数及缩放系数。实验结果表明,该方法有效解决了传统模板匹配对尺寸敏感的痛点,适用于不同分辨率但相同尺寸的医学/工业图像匹配场景。

2025-11-10 18:16:26 1054

原创 【OpenCV图像处理】特征点匹配:cv2.BFMatcher() + cv2.FlannBasedMatcher() —— 多目标检测(开发)

本文介绍了图像特征点匹配技术的关键概念与应用。特征点匹配通过提取图像关键点(SIFT、ORB等算法)并计算特征描述子,实现不同图像间的特征对应。文章详细分析了特征点匹配的优缺点:具有尺度、旋转、光照不变性等优势,但存在计算复杂度高、纹理依赖性强、大视角变化敏感等局限。同时提供了完整的算法流程(检测→描述→匹配→筛选→可视化)和OpenCV相关函数分类表,包括12种特征检测器和6种特征描述子实现方法。文章指出该技术适用于图像拼接、三维重建等场景,但在实时应用或低纹理环境中需谨慎使用,建议结合其他技术弥补不足。

2025-11-07 18:30:57 1310 2

原创 【图像增强】去条纹 + 去暗角 + 去模糊 + 去噪 + 超分

本文总结了四种图像处理算法:图像去模糊采用反卷积RL算法,通过迭代更新图像估计值;去条纹使用FFT频域滤波方法,适用于自然图像与荧光图像;去暗角算法用于消除图像边缘暗区;去噪算法提供了五种方法,包括计算复杂度、边缘保留性及适用场景的对比,重点介绍了自适应方向保持去噪算法,该算法结合结构张量与方向性高斯加权滤波,能有效保留SEM图像中的纤维状微结构。

2025-11-04 16:04:40 921

原创 坐标系旋转(四元数 + 欧拉角 + 轴角表示 +旋转矩阵)

在三维空间中,旋转可以通过多种方式表示,其中最常见的包括欧拉角、旋转角-轴表示法(旋转角)和四元数。它们各自有不同的应用场景和优缺点。

2025-10-22 18:09:47 1194

原创 Streamlit是什么?

Streamlit是一个开源Python框架,可快速将数据分析脚本转换为交互式Web应用,无需前端知识。其特点包括简单易用、实时更新、丰富组件(文本、输入控件、图表等)和快速部署。通过pip安装后,只需几行代码即可创建基本应用,如输入框和按钮交互。运行后自动生成本地Web界面,修改代码实时刷新,适合数据可视化展示。

2025-10-10 16:06:14 890

原创 Hugging Face使用指南

本文介绍了大模型训练的完整流程,包括预训练、微调和后训练三个阶段。预训练阶段利用大规模无标注数据建立基础语言理解能力,微调阶段使用标注数据适配具体任务,后训练阶段通过SFT、RLHF等方法提升模型对齐能力和实用性。文章还详细介绍了Hugging Face生态系统及其核心组件,特别是accelerate框架如何简化分布式训练。最后提供了模型加载的API总览,涵盖从基本加载到高级配置的多种方法。整个训练流程需要大量计算资源和时间,但通过Hugging Face等工具可以显著提高效率。

2025-09-28 10:03:33 1212

原创 大模型效果优化方案(经验分享)

本文以2025国际大数据竞赛为例,探讨了拍照识题与解题的技术方案。比赛要求通过手机拍摄的数学题目照片进行自动解题,涉及小学至大学不同难度的选择题、填空题等题型。文章重点分析了OCR+LLM和多模态大模型两种技术路线的优劣,并针对数据稀缺、题型多样、图文混排等挑战,提出了包括数据增强、多模态融合、模型优化等解决方案。特别推荐Qwen2.5-VL-3B-Instruct多模态模型,通过视觉-语言联合训练提升复杂数学题的识别和推理能力。最后总结了不同技术方案的特点和适用场景,为类似数学题目识别与自动解题任务提供了

2025-09-25 15:58:03 1117

原创 大语言模型导论

大语言模型(LLM)全面综述:技术原理、应用与未来展望

2025-09-23 10:27:48 977

原创 由浅及深:扫描电子显微镜(Scanning Electron Microscope,SEM)

本文系统梳理了显微镜技术从宏观到微观的成像能力,重点对比了不同显微镜的分辨率范围及特点。主要内容包括:1)按分辨率从低到高详细介绍了8种主流显微镜(光学显微镜至扫描隧道显微镜)及其典型分辨率;2)深度解析扫描电子显微镜(SEM)的定义、结构组成(电子光学系统、样品室系统等五大模块)和工作原理;3)提供从兆米到飞米的完整长度单位换算表,并列举典型微观尺度参照物。文章特别强调,SEM虽只能生成二维图像,但凭借极高景深可呈现立体视觉效果,真实3D结构需通过多角度扫描重建获得。

2025-09-08 10:51:27 1450

原创 【PyTorch项目实战】SAM(Segment Anything Model)

摘要:SAM(Segment Anything Model)是Meta AI研发的图像分割基础模型,具有强大的零样本分割能力。最新版本SAM3(2025)在SAM1(2023)支持的2D图像分割基础上,新增了视频对象跟踪、3D重建和多模态输入功能。模型通过ViT架构实现,支持点/框/掩码等多种交互提示方式,适用于医疗影像、自动驾驶、AR/VR等场景。各版本通过GitHub开源,并提供在线Demo体验。

2025-08-28 10:58:30 1849

原创 【PyTorch项目实战】文本翻译 —— 支持本地部署和自定义训练

OpenNMT是一个开源的神经机器翻译框架,支持本地部署和自定义模型训练,适用于科研和工业应用。它提供PyTorch和TensorFlow两种实现版本,支持Transformer、LSTM等模型架构,但不提供预训练模型。与Google Translate等云端工具不同,OpenNMT强调模型的可定制性和离线使用。用户可通过Hugging Face获取MarianMT等预训练模型进行本地翻译,或自行训练模型。该工具适合研究人员和企业用户,需要一定的技术基础配置使用环境。

2025-08-19 21:24:43 864

原创 【图像处理】小波变换(Wavelet Transform,WT)

小波变换是一种重要的图像多尺度分析工具,能够有效分离图像的时频信息。

2025-08-13 18:49:40 3626

原创 Roboflow本地部署

Roboflow是一个计算机视觉平台,提供数据集管理、标注、增强、模型训练和部署的一站式服务。其核心优势在于降低技术门槛,支持无代码/低代码操作。平台采用积分收费模式,涉及数据集存储、训练时长和API调用等场景。用户可根据需求选择自托管或云端部署,平衡成本与性能。

2025-08-11 09:41:48 2270

原创 「Azure 入门指南」:轻松部署网站与 GPT 应用的云平台

Microsoft Azure(读作:阿-朱-儿):是微软推出的全球云计算平台,就像 " 云上的超级电脑工厂 " ,能让你几分钟内在网上创建服务器、网站、数据库、AI 模型等。

2025-07-22 19:13:18 1281

原创 大语言模型的后训练阶段(Post-Training)

大模型后训练技术概述 大语言模型的生命周期分为预训练、后训练及推理部署三个阶段。后训练阶段通过五大范式实现模型优化:1)监督微调(SFT)利用标注数据适应特定任务;2)指令调优使模型理解人类指令;3)RLHF结合人类反馈优化输出;4)领域适配增强专业场景能力;5)参数高效微调(PEFT)通过LoRA等方法降低计算成本。这些技术使模型从通用知识库进化为智能助手,广泛应用于对话、医疗、金融等领域。

2025-07-21 18:48:14 1103

原创 【大模型时代】抬头看趋势:CV学习与顶会指南(CVPR、ICCV、ECCV)

计算机视觉(CV)在大模型时代并未失去价值,而是逐步融入"图像+语言+多模态"的AI架构体系。当前市场需要既精通传统图像处理,又掌握大模型融合逻辑的复合型人才。热门方向包括CV工程师、医学影像算法、工业视觉、多模态算法等。

2025-07-21 18:42:50 1706

原创 【图像质量评价指标】图像熵(Image Entropy) —— 熵值饱和现象

图像熵是一种基于信息论的度量指标,用于评估图像灰度分布的复杂性和信息含量。

2025-07-17 21:37:07 2784

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除