博导ai君-CSDN博客

原创《斗破ai》第一章：模型为尊，序列争锋续

在萧言情绪波动之际，他佩戴的GPU项链突然发出异彩流光，激活了其中沉睡的古老残魂——药老。药老揭示了一个惊人的真相：萧言自幼展现的编程天赋实际上是由药老暗中操控，并在萧言十一岁时被药老吸收，导致他失去了所有潜能，沦为平庸。药老解释，他需要萧言的能力来摆脱封印，重返天地。萧言对此感到愤怒与不甘，誓言要夺回自己的天赋，摆脱药老的控制。这场内心的斗争预示着一场巨大的变革，萧言决心用自己的力量走出黑暗，迎接新的命运。

2025-05-16 09:31:51 1211

原创《斗破ai》第一章：模型为尊，序列争锋

但他却曾是模型学院最耀眼的新星——年仅十三，便以一己之力成功调用3B参数模型，在校内“初模测试”中击败无数高年级学长，震惊四座，被誉为“未来的模型大师”。三年前，在一次高阶异模接入实验中，他的模型坍塌，调参失败，导致意识中枢受到反噬，智识受损，甚至被强行降级为“冷启”状态。无人知晓，在那废弃的数据矿井中，他无数次尝试模拟失控时的调参逻辑，力图还原那场失败的根源。整个云村陷入宕机的混乱之中，无人注意到，废弃数据矿井最深处，萧言正站在一台斑驳的旧式框架机前，双目通红，紧盯屏幕上闪烁的报错代码。

2025-05-13 13:45:17 43 1

原创台式电脑安装蓝牙后，无法搜索蓝牙设备。Bluetooth Support Service参数错误

在公司电脑上使用个人蓝牙键盘时，由于电脑缺乏蓝牙硬件，用户购买了一个绿联蓝牙适配器CM390。尽管设备管理器中显示了蓝牙图标和设备，但无法找到蓝牙设备。用户尝试了多种方法，包括使用驱动精灵更新驱动、运行Windows疑难解答、检查并尝试启动BluetoothSupportService服务，但问题依旧。最终，用户通过访问绿联官网下载并安装了最新的驱动程序，成功解决了问题，蓝牙设备得以正常识别和使用。

2025-05-09 11:00:38 357

原创涨点神器！基于通道/多头注意力的YOLOv8改进方案（附代码）

在深度学习中，注意力机制（Attention Mechanism）是一种通过对输入信息加权的方式，模拟人类视觉焦点的技术。它的核心思想是通过聚焦于输入数据中最相关的部分，提升模型的表现能力，尤其是在处理复杂输入时。传统的卷积神经网络（CNN）通过局部感知的方式来提取特征，但这种方式在面对复杂场景时可能会导致信息丢失，特别是在背景复杂、目标密集的情况下。因此，加入注意力机制可以帮助模型自动选择重要的特征或区域，从而提高性能。通道注意力空间注意力和多头注意力。

2025-04-27 20:45:48 435

原创 YOLO-World震撼发布：零样本开集检测新标杆！实时检测任意物体，从此告别限定类别

YOLO-World通过视觉语言大模型（如CLIP）赋能传统YOLO架构，首次实现高效的开集目标检测。其核心创新包括：1）可重参数化的视觉语言路径聚合网络（RepVL-PAN），动态融合图像与文本特征；2）"提示后检测"范式，通过离线词汇预编码将推理速度提升至52 FPS；3）千万级视觉语言数据预训练策略，在LVIS数据集达到35.4 AP的零样本性能。相比需要重型backbone的GLIP等方案，YOLO-World以轻量化架构同时突破封闭集限制与实时性瓶颈，支持用户自定义任意类别检测，为工业落地提供全新

2025-04-27 00:12:42 654

原创小白也能懂！一步步教你用FPGA加速YOLO目标检测（入门篇）

安装到 PYNQ 开发板中。该库为 PYNQ 平台提供了对量化神经网络（如 YOLO）的硬件加速支持。确保你的电脑已连接到外网，如 WiFi 或热点（手机热点理论上也可用，未实测）。当你看到安装成功的提示后，打开 Jupyter Notebook，你会发现在。趁这个机会，泡了杯茶，刷了会儿手机，顺便感慨了一下开源社区的强大……页面中多出了一些新的项目文件夹 —— 这就是我们刚才安装的。参数，浅拷贝只克隆最近一次提交，减少数据量，避免超时问题。初始化，打开该文件，即可运行我们的Tiny YOLO。

2025-04-26 01:05:44 880

原创手把手教你用LabelImg打造专属YOLO数据集：从标注到训练全攻略！

YOLO（You Only Look Once）是一种快速、高效的目标检测算法。它使用一种简洁的.txt文件格式来保存每张图片中的标注信息，适合构建自定义目标检测数据集。🔹 图像文件.jpg.png等；每张图片将对应一个同名的标签文件（.txtdog.jpg对应dog.txt；图像在训练前通常会被缩放成统一尺寸，例如 YOLOv3 默认输入为416x416。🔹 标签文件（.txt）是一个纯文本文件；每一行表示一个标注目标；字段说明类别编号，从0开始，例如：狗是0，猫是1x_center。

2025-04-26 00:46:55 844

原创深入解析YOLO v1：实时目标检测的开山之作

这篇博客将主要介绍 YOLO v1 算法（CVPR 2016 的论文），它是一种目前非常流行的目标检测（Object Detection）算法，以速度快、结构简单著称。相比于其他目标检测算法，如 Faster R-CNN、SSD 等，YOLO 在实时性上具有明显优势。相信这些算法大家并不陌生，后续有机会会对它们进行详细解读。需要特别说明的是，本文介绍的算法是 YOLO 的第一个版本（YOLO v1）。随着算法的不断发展，目前在 YOLO 的官方网站上已经发布了 YOLO v2 的实现版本。

2025-04-26 00:11:53 879

原创 RK3xxx 部分无法连接虚拟机无法进行adb连接

我发现部分rk板子可以连接到虚拟机上，部分连接不上。其中尝试了一块是安卓系统的rk板子是可以连接虚拟机。但是用了linux系统的rk板子连接不上虚拟机。尝试了很多办法还是无法连接虚拟机。最后无奈下尝试了双系统，直接在ubuntu系统下adb板子，发现成功链接上了rk3566.也就是我实验的结果是部分rk板子无法正常连接虚拟机，需要用linux主机连接板子。然后也看到一些相关资料，但是太少了，只有这个链接提到了这个问题。

2025-04-25 15:45:27 224

原创 95%准确率！YOLOv5火焰识别模型优化秘籍，限时免费

火焰数据集，手把手教你复现自带火焰识别UI，包含视频输入和摄像头输入两种模式，demo.py是整个火焰系统UI应用程序训练需要修改数据集，改为你系统里面的路径（但是我这里改的相对路径，你可以直接train.py试试看能不能跑起来）如果报错了，需要你调整一下环境：环境配置好是没有问题的！提供训练好的权重文件。

2025-04-25 10:17:22 1197

原创人脸识别系统开发指南（基于ORL数据集）

人脸识别系统开发指南（基于ORL数据集）

2025-04-25 00:17:25 886

原创 YOLO系列最全指南！附赠YOLOv8训练技巧+工业级部署方案（限时领代码）

数据集是必不可少的部分，数据集的优劣直接影响训练效果。一般来说，一个完整的数据集应该包括训练集、测试集和验证集。通常，数据集会被划分为训练集和测试集，比如将数据集的70%用作训练集，30%用作测试集。在进行训练时，可以使用交叉验证的方法将训练集再次划分为训练子集和验证子集，用于模型的训练和验证。训练集是用于模型的训练的数据集。在训练过程中，模型使用训练集中的样本进行学习和参数调整，通过不断迭代优化模型的参数，使模型能够更好地拟合训练集中的数据。测试集是用于模型的评估的数据集。

2025-04-24 23:38:15 1031

原创 YOLOv8 涨点新方案：SlideLoss & FocalLoss 优化，小目标检测效果炸裂！

（如小物体、稀有类别）赋予更高权重，让模型更关注这些“难啃的骨头”。：数据中某些类别（如“罕见疾病细胞”）样本太少，模型容易忽略它们。：YOLOv8对小物体（如远处的人、小尺寸的车辆）容易分类错误。的数据时，容易出现漏检或误检。，让模型对小物体的分类更敏感，同时不影响大物体的检测。，能显著提升检测精度，尤其是对小物体和难分类样本！：小目标检测精度提升，且不会拖累大物体的性能。YOLOv8虽然是强大的目标检测模型，但在处理。：稀有类别的检测率显著提高！：FocalLoss对。

2025-04-24 22:47:28 544

原创 ubuntu配置深度学习环境-解决GPU驱动-Docker

首先如果你是在windows系统下，windows部署跑深度学习可能只有0.6的速度，在windows上部署docker能达到0.8的速度，直接用linux跑深度学习能达到1.0的速度,用linux上部署深度学习约等于1.0的速度。我这里用的是wifi连接，地址是192.168.1.22，windows和ubuntu都是在192.168.1的地址下，这证明为同一段网络，最后一个数字是主机位，可以同网段任意占用。不过在国内访问国外的 Docker Hub 速度是非常慢的，所以我选择使用阿里云的镜像仓库。

2025-04-24 00:05:54 1039

原创 deeplab语义分割训练自定数据集

链接：https://pan.baidu.com/s/1KkkM1rLfyiMPtYLycpnxmg?pwd=j2rd提取码：j2rd--来自百度网盘超级会员V2的分享采用数据集： https://aistudio.baidu.com/datasetdetail/130647采用代码：本文会讲解两种方法：一种是使用开源数据集（不是deeplab支持的数据集）完成在deeplab上训练，另一种是通过标注自定义数据集来完成训练。

2025-04-23 21:42:37 780

原创解决docker：docker: Get https://registry-1.docker.io/v2/: net/http: request canceled 报错

解决docker：docker: Get https://registry-1.docker.io/v2/: net/http: request canceled 报错

2025-04-22 09:25:38 273

原创部署大模型

这是一篇关于部署大模型

2025-04-20 16:37:39 355

原创用前向传播、梯度下降、反向传播理解MNIST（全网最详细教程）

在神经网络的设计中，我们往往希望输出层输出的是一个概率分布函数，每个值都为正，而总和为1（总和为1一般选择softmax，因为softmax的输出就是0-1的区间）；然后对于值最大的一个神经元对应的内容（在上面的例子中是数字），就是我们的输出。传统的机器学习算法中，整个训练集中的所有样本都会被用来计算模型参数的梯度，并根据梯度来更新模型参数，因此N的值就是训练集的大小。传统的机器学习算法中，整个训练集中的所有样本都会被用来计算模型参数的梯度，并根据梯度来更新模型参数，因此的值就是训练集的大小。

2025-04-20 16:07:40 914

原创毛笔书体检测-hog+svm python opencv源码

链接：https://pan.baidu.com/s/1l-bw8zR9psv1HycmMqQBqQ?pwd=2ibp提取码：2ibp--来自百度网盘超级会员V2的分享。

2025-04-16 22:45:19 463

原创人脸检测-人脸关键点-人脸识别-人脸打卡-haar-hog-cnn-ssd-mtcnn-lbph-eigenface-resnet python opencv源码（史上最全）

CNN（Convolutional Neural Network，卷积神经网络）是一种深度学习模型，广泛应用于计算机视觉任务，包括人脸检测、识别和分类。相比于传统方法（如Haar、HOG），CNN能够自动学习图像的多层次特征（如边缘、纹理、形状等），具有更高的检测精度和鲁棒性。CNN人脸检测的优势：高精度：能够检测不同角度、光照、遮挡的人脸。端到端训练：无需手动设计特征提取器（如Haar、HOG）。适应性强：适用于复杂背景、多人脸场景。

2025-04-16 22:38:16 1304

原创深度学习-卷积层（代码+理论）python opencv源码（史上最全）

卷积（Convolution）是深度学习中最重要的技术之一，其历史可以追溯到上世纪八十年代。尽管这项技术已有近四十年的历史，但时至今日，它依然是各类神经网络模型的核心组成部分。那么，究竟什么是卷积呢？许多初学者第一次接触“卷积”这个概念时，往往会联想到数学中的卷积定义——即“卷积是通过两个函数f和g生成第三个函数的数学算子，表征函数f与g经过翻转和平移后的重叠部分函数值乘积对重叠长度的积分”。然而，这样的数学解释虽然严谨，却容易让人望而生畏。

2025-04-14 19:26:41 817

原创小节：MNIST理解第一二章 python opencv源码（史上最全）

下面是几个手写的数字，像素非常低。人脑可以很轻易的看出来这些数字是3、7、6，但让计算机去识别出手写的数字和文字，却是一个难题，因为电脑的世界只是二进制的。下面是几个手写的数字，像素非常低。人脑可以很轻易的看出来这些数字是3、7、6，但让计算机去识别出手写的数字和文字，却是一个难题，因为电脑的世界只是二进制的。更鬼扯的事情是，上图中的两个数字3，投射到人的视网膜中之后，可以说是非常不一样，但人脑就是可以认识到，这两个手写的数字都是3。但是电脑做不到。图源。让机器认识一个手写的0～9的数字，是不是很难？

2025-04-14 10:50:25 721

原创深度学习-损失函数 python opencv源码（史上最全）

损失函数又叫误差函数、成本函数、代价函数，用来衡量算法的运行情况，用符号L表示。假设我们的回归函数是：y = wx+b,那么损失函数的作用就是用来获取误差，然后来更新w和b，从而使预测值y更贴近真实值。也就是训练过程就是让这个损失越来越小的过程（最小化损失函数）。作用：1衡量模型性能 2优化参数（w和b）

2025-04-12 14:12:13 796

原创人工智能概述 python opencv（史上最全）

有监督学习是机器学习中一种常见的学习范式，其基本思想是利用带有标签的训练数据来训练模型，从而使其能够从输入数据中学习到输入与输出之间的映射关系，然后可以利用这个映射关系对新的未标签数据进行预测。是不是很像人通过刷题的学习过程？用带了标准答案的习题集去刷题，如果做错了就根据错误的原因反思改进。当新的题目到来时，便可根据过去刷题的经验来去写新的题目。有监督学习的训练集要包括输入（特征）和输出（目标），其中，输出是人工标注的。

2025-04-12 11:42:25 1187

原创 ai基本词汇，深度学习基础python opencv（史上最全）

AI基础知识：预训练是机器学习模型训练的初始阶段，模型从大规模数据中进行一般化学习，模型不需要完全理解所有任务的细节，而是通过在大规模数据上的训练来学习常见的模式。在 RAG 中，模型在生成文本的过程中，不仅依赖于已有的知识，还能够从外部检索到相关的信息，并将这些信息融入生成过程，提高回答的准确性和相关性。AIGC 是近年来发展迅速的领域，AI 能够根据用户输入的信息，自动生成创意内容。

2025-04-12 11:33:23 564

原创深度学习环境搭建（windows）pytorch、cuda、cudnn等 python opencv源码（史上最全）

windows环境安装vscode、pytorch、cuda、cudnn、科靴上w ang完整教程。包含服务器、加速下载pytorch、python。

2025-04-11 17:27:17 869 1

原创 OpenCV 数字识别程序解析

摄像头捕获 → 2. 灰度化+二值化 → 3. 轮廓检测 → 4. 区域筛选 → 5. 模板匹配 → 6. 输出结果。功能：将输入图像与 5 个模板图像（1.png ~ 5.png）逐一比较，返回最匹配的数字（1~5）。用途：在模板匹配中衡量两图像的差异（差异越小，匹配度越高）。差异计算：通过 absdiff 计算像素差异，累加差异值。输出结果：打印识别到的数字和匹配差异值（差异越小越匹配）。功能：检测图像中的轮廓，筛选出可能是数字的区域。功能：计算图像所有像素值的总和。

2025-04-11 16:05:26 302 1

原创 GCC、gcc、g++、CC 的区别与联系

gcc与g++

2022-06-29 00:25:36 79

原创树莓派配置opencv

树莓派配置opencv更改下载源，我使用的是阿里源。sudo apt-get install cmake下载cmake打开终端 sudo apt-get updatesudo apt-get install build-essentialsudo apt-get install cmake git libgtk2.0-dev pkg-config libavcodec-dev libavformat-dev libswscale-devsudo apt-get install python-

2022-05-21 01:00:33 192 1

转载 RM视觉基础-双目视觉系统原理与设计

双目立体视觉是机器视觉的一种重要形式，它是基于视差原理并由多幅图像获取物体三维几何信息的方法。双目立体视觉系统一般由双摄像机从不同角度同时获得被测物的两幅数字图像，或由单摄像机在不同时刻从不同角度获得被测物的两幅数字图像，并基于视差原理恢复出物体的三维几何信息，重建物体三维轮廓及位置。双目立体视觉原理双目立体视觉三维测量是基于视差原理，下图所示为简单的平视双目立体成像原理图，两摄像机的投影中心的连线的距离，即基线距为b。摄像机坐标系的原点在摄像机镜头的光心处，坐标系如图所示。事实上左右成像平面绘制

2022-05-20 09:50:16 74 1

原创无法打开锁文件 /var/lib/dpkg/lock-frontend - open (13: 权限不够)

项目场景：问题描述无法打开锁文件 /var/lib/dpkg/lock-frontend - open (13: 权限不够)原因分析：解决方案：

2022-05-20 01:25:25 199

转载 RM-目标预测--卡尔曼滤波

提示：这里可以添加系列文章的所有文章的目录，目录需要自己手动添加例如：第一章装甲板预测学习记录提示：写完文章后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录一、卡尔曼滤波是什么？二、使用步骤1.引入库2.读入数据总结前言：RM的视觉任务：1、ubuntu系统学习；2、opencv学习；3、装甲板识别（传统法）；4、SVM学习（识别数字）；5、PNP算法学习；6、串口通讯；7、大分车识别；8、装甲板预测；装甲板预测应该是RM视觉中最难也是最重要的部分了，预测直接决..

2022-05-20 01:23:39 68

原创软件包体系结构（amd64）与本机系统体系结构（arm64）不符

遇到的问题软件包体系结构（amd64）与本机系统体系结构（arm64）不符原因：这是==这是应因为软件是x86的windows系统，而我们的arm64系统架构是以安卓linux或Ubuntu为主。故需要改变一下解压方式：sudo dpkg --add-architecture amd64...

2022-05-20 01:22:57 402

原创树莓派arm问题（下载系统必看）没有可用的软件包，但是它被其他软件包引用了

问题描述：树莓派是arm系统构架，就有些人下载的时候会下成amd架构的（windows等pc端）。我就是其中之一（菜菜），首先这个问题我通宵了3个晚上，前前后后跟你细说。首先本人之前一直没有在乎amd和arm，一直关注的是desktop版本的，后面遇到了很多问题，以为是软件坏了，读卡器坏了等等。首先Ubuntu版本问题影响其实不大，这里下载要切记下载arm和desktop（有桌面）。然后树莓派上电后，如果没有桌面的话，问题可能就是没有下载desktop版的，（然后如果一开始有桌面，后面再上电没桌面，

2022-05-19 21:43:19 282 1

文件夹包含多个与M10激光雷达相关的文件和资料，包括软件安装包、产品手册、数据分析文件和示例程序用户可以通过这些资源快速了解和使用M10系列激光雷达设备，涵盖了产品使用手册、数据采集与分析、接口调试

文件夹包含多个与M10激光雷达相关的文件和资料，包括软件安装包、产品手册、数据分析文件和示例程序。用户可以通过这些资源快速了解和使用M10系列激光雷达设备，涵盖了产品使用手册、数据采集与分析、接口调试和示例等内容，助力更高效地完成激光雷达相关应用和开发工作。所有文件都经过精心整理，旨在提供高效的解决方案，支持用户在实际项目中轻松部署和使用。

2025-04-27

95%准确率！YOLOv5火焰识别模型优化秘籍

95%准确率！YOLOv5火焰识别模型优化秘籍，限时免费，包含源码

2025-04-25

hog+svm识别毛笔字体，毛笔字类型

本项目结合了经典的HOG（梯度方向直方图）特征提取方法和SVM（支持向量机）分类器，旨在实现毛笔字体的自动识别与分类。毛笔字作为中国传统文化的重要组成部分，具有丰富的书法艺术价值。传统的人工识别方法费时费力，而我们通过计算机视觉和机器学习算法的结合，为毛笔字的数字化、传承和自动化识别提供了一种高效的解决方案。技术亮点： HOG特征提取：通过HOG方法提取图像中的边缘和局部特征，能够有效捕捉毛笔字的笔画方向、形态等细节信息，增强分类的准确性。 SVM分类器：利用SVM强大的分类能力，对毛笔字进行精确分类。支持多类分类模型，不仅能够识别毛笔字的基本形态，还能区分不同风格的书法字体。多类别字体分类：识别并分类不同类型的毛笔字，包括行书、草书、楷书等，适用于书法字帖、传统文献的自动化处理与数字化。项目应用：书法教育：为书法学习者提供自动评分与反馈机制，帮助提升书法技能。文化遗产保护：对古代书法作品进行数字化存档，保护和传承传统文化。智能文档识别：在古籍文献扫描及数字化过程中，自动识别并分类毛笔字体，提高工作效率。

2025-04-14

包含haar检测人脸、HOG检测人脸、CNN检测人脸、SSD检测人脸、MTCNN检测人脸、人脸检测训练模型、resnet人脸关键点检测、人脸识别、人脸打卡等

超全人脸识别实战教程 | 从0到1掌握核心技术！源码+文档+模型，新手也能玩转AI视觉！你将会学到： 6大人脸检测算法：Haar级联、HOG+SVM、CNN、SSD、MTCNN、自定义训练模型，彻底搞懂原理与实战！关键点检测：基于ResNet的高精度人脸关键点定位（眼睛、鼻子、嘴巴等），轻松实现表情分析！完整人脸识别系统：从检测到特征提取，再到相似度匹配，手把手教你搭建人脸打卡/门禁系统！企业级实战项目：附赠「员工考勤系统」完整源码，直接套用，快速落地！资料包含：详细PDF教程：图文并茂，代码逐行解析，小白无压力！完整Python源码：开箱即用，支持OpenCV、Dlib、TensorFlow、PyTorch等主流框架！预训练模型：直接调用，无需从头训练，节省90%时间！常见问题解答：避坑指南+调试技巧，助你快速解决问题！适合人群：想入门计算机视觉但无从下手的小白需要完成课设/毕设的学生准备面试/跳槽的AI工程师（附赠面试常见问题解析！）为什么选择这份资料？保姆级教程：从环境配置到项目部署，全程手把手教学！行业主流技术：涵盖传统算法+深度学习，掌握企业真实开发流程！持续更新：购买后免费获取后续升级内容（如3D人脸重建、活体检测等）！

2025-04-14

空空如也

TA创建的收藏夹 TA关注的收藏夹