- 博客(228)
- 资源 (1)
- 收藏
- 关注
原创 【TensorRT C++ API模型加速】TensorRT环境配置、模型转换、CUDA C++加速、TensorRT C++ 加速
TensorRT(Tensor Runtime,TRT):由 NVIDIA 开发,专为 NVIDIA GPU 设计的,用于深度学习高性能推理的SDK (software development kit ,软件开发工具包),可为推理应用程序提供低延迟和高吞吐量。
2024-12-17 20:09:49
2620
原创 【Python/C API】使用C/C++调用Python
Python/C API:是 Python 提供的 C 语言的 API 库。实现在 C/C++ 中嵌入 Python 代码,包括C/C++ 调用 Python 函数、C/C++ 操作 Python 对象、双向通信等等。
2024-12-16 21:52:45
3646
1
原创 【Git版本控制】配置 + 下载 + 上传 + 查看 + 添加 + 提交 + 拉取 + 推送 + 撤回
Git配置文件.gitignore用于指定Git应忽略的文件和目录,不纳入版本控制。其核心作用包括排除临时文件、保护敏感信息、减少仓库体积和保持提交历史清晰。工作原理是Git读取项目中的.gitignore文件规则,在git add时自动排除匹配文件。注意事项:文件需提交到仓库,已提交文件需先移除才能忽略,支持多级目录配置和全局规则。 Git命令行操作五步法:1) git init初始化(首次);2) git add添加文件;3) git commit提交修改;4) git push首次推送;5) 后续直接
2023-11-20 10:47:54
2412
原创 PyQt6新手教程(七万字)
PyQt是Python编程语言的一个GUI(图形用户界面)工具包,它允许开发人员使用Python语言创建桌面应用程序。PyQt是基于Qt库的Python封装,Qt是一个流行的C++框架,用于开发跨平台的应用程序。
2023-11-01 11:31:35
53880
18
原创 深入浅出:Python内存管理机制
python采用自动内存管理机制:又叫垃圾回收器(garbage collector,gc)。负责定期地扫描并自动回收不再使用的内存和对象,使得开发者可以专注于程序逻辑,而不必担心内存管理问题。
2023-10-23 09:47:31
5833
3
原创 多线程与多进程(原理详解 + 函数详解 + 项目实战 + 经验分享)
进程是操作系统中的一个执行单元;多进程是同时运行多个进程的机制;线程是进程中的一个执行单元;多线程是在一个进程中同时运行多个线程;
2023-09-27 08:18:46
3006
1
原创 【Conda虚拟环境】新建 + 激活 + 安装 + 查看 + 退出 + 删除 + 复制 + 导出 + 导入 + 更改
(1)创建虚拟环境(2)激活虚拟环境(4)查看虚拟环境(3)退出虚拟环境(5)删除虚拟环境(6)复制虚拟环境(7)导出虚拟环境(8)导入虚拟环境(9)更改虚拟环境的安装路径(10)在指定路径下,配置虚拟环境
2023-08-16 09:47:12
42617
8
原创 yolov7目标检测:基于自定义数据集完成检测、训练、测试
主要分三步:(1)环境配置与文件配置(2)检测(3)训练。其中,检测和训练都是可以独立进行的。检测是依赖于权重文件即可运行,而训练是基于自定义训练数据集和超参数生成权重文件。
2023-03-25 20:39:11
6862
13
原创 【深度学习环境配置】Anaconda + PyCharm + CUDA + cuDNN + PyTorch + OpenCV
(1)【CPU版本】Anaconda(Python) + Pycharm + Pytorch(CPU) + Opencv(2)【GPU版本】Anaconda(Python) + Pycharm + CUDA + cuDNN + Pytorch(GPU) + Opencv
2023-02-23 02:00:00
25108
4
原创 Python常用内置函数(全)
详解Python常用函数,并深度剖析彼此的联系。共包括五个大类:数据类型、数据结构、高阶函数、通用函数、数学函数。
2023-01-15 20:38:39
14501
2
原创 三万字硬核详解:yolov1、yolov2、yolov3、yolov4、yolov5、yolov7
Yolo (You Only Look Once) 是目标检测 one-state 的神经网络模型,可以在图像中找出特定物体, 并识别种类和位置。
2023-01-08 00:57:12
28991
11
原创 六万字硬核详解:卷积神经网络CNN(原理详解 + 项目实战 + 经验分享)
深入解析卷积神经网络(CNN)的实际应用,全面整理并梳理了CNN的关键知识点。从基础概念到实战技巧,加速理解与实战,并解决实际问题。
2022-10-31 07:57:08
63525
38
原创 【PyTorch基础】数据处理工具箱 + 神经网络工具箱 + Tensor基础 + Numpy基础
详细介绍Pytorch的数据处理工具箱、神经网络工具箱、Tensor基础、Numpy基础。PyTorch 是一个由 Facebook 团队于 2017 年发布的深度学习框架,是 Torch 框架在 Python 上的衍生。
2022-10-25 01:35:37
6344
9
原创 AI 编程工具的三次范式跃迁:代码级生成、文件级协作、项目级认知
本文系统梳理了 AI 编程工具从 2021 年至今的关键演进路径:从 Copilot 验证代码生成可行性,到 Cursor 重构编辑器交互范式,再到 DeepSeek 与 Trae 推动能力普惠化。文章进一步指出,当前阶段的核心分水岭已不在模型本身,而在于是否具备项目级理解与长期上下文记忆能力,这也是国内外 AI 编程工具形成阶段性差距的关键所在。
2025-12-31 10:20:06
883
原创 FastAPI从入门到实战:打造高性能图像处理Web应用
FastAPI是一个基于Python的高性能Web框架,以其快速、易用和自动生成API文档等特点广受欢迎。本文介绍了FastAPI的基本使用,包括环境配置、创建Hello World应用、运行服务器以及自动生成的交互式API文档。通过示例代码演示了路径参数、查询参数和请求体的处理方式,展示了FastAPI结合Pydantic进行数据验证的能力。该框架特别适合需要快速开发RESTful API的场景,其自动类型检查和文档生成功能极大提升了开发效率。
2025-12-18 16:36:38
908
原创 【PyTorch项目实战】Ultralytics YOLO模型本地部署(训练 + 测试 + 推理)
YOLO(You Only Look Once)是Ultralytics推出的实时目标检测生态系统,支持检测、分割、分类、姿态估计和跟踪等任务。新一代YOLOE模型统一了多种视觉任务,具有实时性、多任务处理能力和视觉提示增强功能。其核心架构包含特征提取、融合和任务解码模块,提供不同规模的模型选择。YOLOE支持文本、视觉提示和内置词汇表三种交互方式,其中视觉提示分割(VPSeg)通过框选或掩码引导模型关注特定区域。模型特点包括自动下载预训练权重、多平台部署支持,但对不封闭目标和未训练数据表现有限。Ultra
2025-12-10 10:31:10
969
原创 【PyTorch项目实战】SAM3:概念分割 + 3D重建(模型 + 人体)
SAM 3是Meta推出的新一代通用图像分割模型,相比前代SAM/SAM2在性能上有显著提升。核心创新包括提示式概念分割(PCS)任务、解耦识别架构、多模态提示融合等。支持图像分割、视频跟踪、开放词汇识别等功能,推理速度更快(A100上<200ms)。新增400万条概念标签数据,扩展了开放词汇理解能力。应用场景涵盖图像/视频标注、多目标跟踪等,但3D重建精度仍有提升空间。
2025-11-30 12:07:10
1244
8
原创 【PyTorch项目实战】Swin-Unet:用于医学图像分割的类Unet纯Transformer模型
摘要 本文介绍了Swin-Unet,一种基于纯Transformer架构的医学图像分割模型。Swin-Unet通过将Swin Transformer与U-Net结构相结合,构建了首个完全摒弃卷积的U型分割网络。该方法利用移位窗口自注意力机制(SW-MSA)实现全局上下文建模,同时通过层次化特征提取和多尺度融合保留局部细节。实验表明,Swin-Unet在医学图像分割任务中超越了传统CNN方法,标志着从卷积主导到Transformer驱动的技术过渡。文章还梳理了医学分割技术的发展历程,从早期CNN模型、Tran
2025-11-19 14:07:08
1129
原创 【OpenCV图像处理】深度学习:cv2.dnn() —— 图像分类、人脸检测、目标检测
OpenCV DNN模块提供高效的深度学习推理能力,支持加载多种框架的预训练模型(Caffe/TensorFlow/ONNX/YOLO等),无需依赖完整深度学习框架。其核心优势包括轻量级部署、多硬件支持(CPU/GPU)和丰富的计算机视觉任务应用(分类/检测/分割等)。典型使用流程为:加载模型→预处理输入→前向传播→解析输出。以GoogleNet图像分类为例,需下载.prototxt网络结构、.caffemodel权重及类别标签,通过cv2.dnn.readNetFromCaffe()加载模型,blobFr
2025-11-17 11:08:40
1051
2
原创 【OpenCV图像处理】级联分类器:cv2.CascadeClassifier() —— 目标检测(猫脸/人脸/眼睛/微笑/全身/车牌)
Haar 级联分类器(Haar Cascade Classifier):是 OpenCV 中一种基于 Haar 特征 和 AdaBoost 分类算法的物体检测方法,广泛应用于人脸、眼睛、行人等物体的检测。
2025-11-14 10:15:24
689
原创 【OpenCV图像处理】图像去噪:cv2.fastNlMeansDenoising()
cv2.fastNlMeansDenoising() 是一种基于非局部均值去噪(Non-Local Means, NLM)的方法,旨在去除图像中的噪声。其核心思想是在图像的局部区域内,通过计算相似性并加权平均周围像素的值来减少噪声,同时保持图像的细节和边缘。
2025-11-13 16:21:48
977
原创 【OpenCV图像处理】模板匹配:cv2.matchTemplate() —— 具有尺度与旋转不变性(开发)
本文摘要:针对高分辨率模板与低分辨率原图的尺寸不变匹配需求,提出两种解决方案:(1)单尺度手动缩放匹配,通过预定义缩放因子调整模板尺寸;(2)多尺度金字塔自动搜索,在0.1-1.0范围内迭代寻找最优匹配。两种方法均采用OpenCV的模板匹配算法(TM_CCOEFF_NORMED),其中自动方法能适应未知缩放比例,输出最佳匹配位置、分数及缩放系数。实验结果表明,该方法有效解决了传统模板匹配对尺寸敏感的痛点,适用于不同分辨率但相同尺寸的医学/工业图像匹配场景。
2025-11-10 18:16:26
1054
原创 【OpenCV图像处理】特征点匹配:cv2.BFMatcher() + cv2.FlannBasedMatcher() —— 多目标检测(开发)
本文介绍了图像特征点匹配技术的关键概念与应用。特征点匹配通过提取图像关键点(SIFT、ORB等算法)并计算特征描述子,实现不同图像间的特征对应。文章详细分析了特征点匹配的优缺点:具有尺度、旋转、光照不变性等优势,但存在计算复杂度高、纹理依赖性强、大视角变化敏感等局限。同时提供了完整的算法流程(检测→描述→匹配→筛选→可视化)和OpenCV相关函数分类表,包括12种特征检测器和6种特征描述子实现方法。文章指出该技术适用于图像拼接、三维重建等场景,但在实时应用或低纹理环境中需谨慎使用,建议结合其他技术弥补不足。
2025-11-07 18:30:57
1310
2
原创 【图像增强】去条纹 + 去暗角 + 去模糊 + 去噪 + 超分
本文总结了四种图像处理算法:图像去模糊采用反卷积RL算法,通过迭代更新图像估计值;去条纹使用FFT频域滤波方法,适用于自然图像与荧光图像;去暗角算法用于消除图像边缘暗区;去噪算法提供了五种方法,包括计算复杂度、边缘保留性及适用场景的对比,重点介绍了自适应方向保持去噪算法,该算法结合结构张量与方向性高斯加权滤波,能有效保留SEM图像中的纤维状微结构。
2025-11-04 16:04:40
921
原创 坐标系旋转(四元数 + 欧拉角 + 轴角表示 +旋转矩阵)
在三维空间中,旋转可以通过多种方式表示,其中最常见的包括欧拉角、旋转角-轴表示法(旋转角)和四元数。它们各自有不同的应用场景和优缺点。
2025-10-22 18:09:47
1194
原创 Streamlit是什么?
Streamlit是一个开源Python框架,可快速将数据分析脚本转换为交互式Web应用,无需前端知识。其特点包括简单易用、实时更新、丰富组件(文本、输入控件、图表等)和快速部署。通过pip安装后,只需几行代码即可创建基本应用,如输入框和按钮交互。运行后自动生成本地Web界面,修改代码实时刷新,适合数据可视化展示。
2025-10-10 16:06:14
890
原创 Hugging Face使用指南
本文介绍了大模型训练的完整流程,包括预训练、微调和后训练三个阶段。预训练阶段利用大规模无标注数据建立基础语言理解能力,微调阶段使用标注数据适配具体任务,后训练阶段通过SFT、RLHF等方法提升模型对齐能力和实用性。文章还详细介绍了Hugging Face生态系统及其核心组件,特别是accelerate框架如何简化分布式训练。最后提供了模型加载的API总览,涵盖从基本加载到高级配置的多种方法。整个训练流程需要大量计算资源和时间,但通过Hugging Face等工具可以显著提高效率。
2025-09-28 10:03:33
1212
原创 大模型效果优化方案(经验分享)
本文以2025国际大数据竞赛为例,探讨了拍照识题与解题的技术方案。比赛要求通过手机拍摄的数学题目照片进行自动解题,涉及小学至大学不同难度的选择题、填空题等题型。文章重点分析了OCR+LLM和多模态大模型两种技术路线的优劣,并针对数据稀缺、题型多样、图文混排等挑战,提出了包括数据增强、多模态融合、模型优化等解决方案。特别推荐Qwen2.5-VL-3B-Instruct多模态模型,通过视觉-语言联合训练提升复杂数学题的识别和推理能力。最后总结了不同技术方案的特点和适用场景,为类似数学题目识别与自动解题任务提供了
2025-09-25 15:58:03
1117
原创 由浅及深:扫描电子显微镜(Scanning Electron Microscope,SEM)
本文系统梳理了显微镜技术从宏观到微观的成像能力,重点对比了不同显微镜的分辨率范围及特点。主要内容包括:1)按分辨率从低到高详细介绍了8种主流显微镜(光学显微镜至扫描隧道显微镜)及其典型分辨率;2)深度解析扫描电子显微镜(SEM)的定义、结构组成(电子光学系统、样品室系统等五大模块)和工作原理;3)提供从兆米到飞米的完整长度单位换算表,并列举典型微观尺度参照物。文章特别强调,SEM虽只能生成二维图像,但凭借极高景深可呈现立体视觉效果,真实3D结构需通过多角度扫描重建获得。
2025-09-08 10:51:27
1450
原创 【PyTorch项目实战】SAM(Segment Anything Model)
摘要:SAM(Segment Anything Model)是Meta AI研发的图像分割基础模型,具有强大的零样本分割能力。最新版本SAM3(2025)在SAM1(2023)支持的2D图像分割基础上,新增了视频对象跟踪、3D重建和多模态输入功能。模型通过ViT架构实现,支持点/框/掩码等多种交互提示方式,适用于医疗影像、自动驾驶、AR/VR等场景。各版本通过GitHub开源,并提供在线Demo体验。
2025-08-28 10:58:30
1849
原创 【PyTorch项目实战】文本翻译 —— 支持本地部署和自定义训练
OpenNMT是一个开源的神经机器翻译框架,支持本地部署和自定义模型训练,适用于科研和工业应用。它提供PyTorch和TensorFlow两种实现版本,支持Transformer、LSTM等模型架构,但不提供预训练模型。与Google Translate等云端工具不同,OpenNMT强调模型的可定制性和离线使用。用户可通过Hugging Face获取MarianMT等预训练模型进行本地翻译,或自行训练模型。该工具适合研究人员和企业用户,需要一定的技术基础配置使用环境。
2025-08-19 21:24:43
864
原创 Roboflow本地部署
Roboflow是一个计算机视觉平台,提供数据集管理、标注、增强、模型训练和部署的一站式服务。其核心优势在于降低技术门槛,支持无代码/低代码操作。平台采用积分收费模式,涉及数据集存储、训练时长和API调用等场景。用户可根据需求选择自托管或云端部署,平衡成本与性能。
2025-08-11 09:41:48
2270
原创 「Azure 入门指南」:轻松部署网站与 GPT 应用的云平台
Microsoft Azure(读作:阿-朱-儿):是微软推出的全球云计算平台,就像 " 云上的超级电脑工厂 " ,能让你几分钟内在网上创建服务器、网站、数据库、AI 模型等。
2025-07-22 19:13:18
1281
原创 大语言模型的后训练阶段(Post-Training)
大模型后训练技术概述 大语言模型的生命周期分为预训练、后训练及推理部署三个阶段。后训练阶段通过五大范式实现模型优化:1)监督微调(SFT)利用标注数据适应特定任务;2)指令调优使模型理解人类指令;3)RLHF结合人类反馈优化输出;4)领域适配增强专业场景能力;5)参数高效微调(PEFT)通过LoRA等方法降低计算成本。这些技术使模型从通用知识库进化为智能助手,广泛应用于对话、医疗、金融等领域。
2025-07-21 18:48:14
1103
原创 【大模型时代】抬头看趋势:CV学习与顶会指南(CVPR、ICCV、ECCV)
计算机视觉(CV)在大模型时代并未失去价值,而是逐步融入"图像+语言+多模态"的AI架构体系。当前市场需要既精通传统图像处理,又掌握大模型融合逻辑的复合型人才。热门方向包括CV工程师、医学影像算法、工业视觉、多模态算法等。
2025-07-21 18:42:50
1706
原创 【图像质量评价指标】图像熵(Image Entropy) —— 熵值饱和现象
图像熵是一种基于信息论的度量指标,用于评估图像灰度分布的复杂性和信息含量。
2025-07-17 21:37:07
2784
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅