自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

q742971636的博客

日常开发记录

  • 博客(1710)
  • 资源 (125)
  • 收藏
  • 关注

原创 VLM Qwen2.5VL GRPO训练微调 EasyR1 多机多卡训练(2)

脚本首先设置分布式训练参数(如节点数、GPU数量、主节点IP等),然后根据当前节点的RANK值区分主节点和工作节点:主节点启动Ray head服务并等待所有工作节点连接,工作节点则连接到主节点。当集群就绪后,主节点会启动训练脚本(qwen2_5_vl_7b_grpo_train.sh),同时集成了SwanLab实验跟踪工具,支持云端和本地训练日志记录。verl 依托于 Ray, 所以多机多卡使用需要使用Ray进行训练,Ray和torchrun的原理也差不多。

2025-05-02 16:09:02 91

原创 VLM-R1 训练:max_anyres_num 参数与多图处理机制解析

通过这次深入分析,我们了解到是控制 InternVL 图像分块数量、平衡细节与资源消耗的关键参数,合理调整它可以有效缓解显存压力。同时,我们也确认了 VLM-R1 框架具备完善的多图像样本处理能力。希望这些信息能帮助大家在训练自己的多模态模型时,更加得心应手!

2025-05-01 17:06:42 97

原创 如何强制关闭Qwen/Qwen3的思考功能

也就相当于enable_thinking参数你传不传这里都是默认enable_thinking就是false,模板永远给空。在之前的文章里,教学了部署和请求的时候去给参数从而关闭thinking:https://www.dong-blog.fun/post/2053。翻译出来就是,如果enable_thinking被定义了,而且enable_thinking参数是false,那么think直接给空。但是还是麻烦,能不能默认就把这个thinking给关闭,从代码层面直接关闭?

2025-04-30 11:45:36 123

原创 使用 Ziegler-Nichols 法进行 PID 参数整定:实践指南

Ziegler-Nichols 方法是一种基于系统临界响应的实验整定方法,由 John G. Ziegler 和 Nathaniel B. Nichols 在 20 世纪 40 年代提出。该方法无需对系统进行复杂的数学建模,适用于大多数线性或近似线性的动态系统。Ziegler-Nichols 方法是一种经典的 PID 参数整定手段,尤其适用于缺乏精确系统模型或需快速部署控制算法的场景。虽然它不能保证最优性能,但提供了一个良好的起点。

2025-04-29 11:17:37 1032

原创 利用EMQX实现单片机和PyQt的数据MQTT互联

本文将介绍一个基于MQTT协议的设备监控与控制系统,该系统由两部分组成:模拟单片机设备和PyQt客户端。系统运行后,设备模拟器会每2秒发送一次GPS数据,PyQt客户端会实时显示这些数据,并可通过按钮或自定义文本发送控制命令。设备模拟器使用随机生成的GPS坐标数据,模拟设备移动的场景,同时能够对不同类型的命令做出响应。该系统基于发布-订阅模式,采用MQTT协议实现设备与客户端之间的双向通信。这种设计解决了MQTT回调线程与GUI线程的冲突问题,确保了应用程序的稳定性。):客户端向此主题发布控制命令。

2025-04-28 17:37:52 854

原创 InternVL 3的技术深度分析,代码与原理

我将对InternVL 3进行更深入的技术分析,结合代码和公式来详细阐述其核心技术、训练方法和推理部署。

2025-04-18 18:54:04 114

原创 VMware Ubuntu挂载Windows机器的共享文件

通过以上步骤,您可以在VMware Ubuntu中无缝访问Windows共享文件夹。这种方法比其他文件传输方式更高效,特别适合需要频繁在两个系统间编辑同一文件的场景。记住,安全起见,建议使用凭证文件而非直接在命令行中输入密码,并确保共享设置仅允许必要的最小权限。

2025-04-15 17:07:49 802

原创 VLM-R1GRPO微调,强化学习训练, 实战训练教程(2)

此项目更新了,支持更多功能。

2025-04-11 17:48:39 1091

原创 Stable Diffusion:使用ControlNet为黑白照片上色

用途:专为黑白照片上色设计的轻量化模型核心特点• 老照片修复/历史影像彩色化的理想选择• 基于ControlNet架构,采用LoRA(低秩适应)技术实现模型瘦身:• 原版ControlNet:4.7GB → Control-LoRA:仅738MB/377MB• 训练时覆盖多样化图像概念和比例,具备优秀泛化能力HuggingFace项目页more。

2025-04-11 09:48:31 1165

原创 Qwen 2.5 VL 图片转公式,微调实战教学

数据集:https://modelscope.cn/datasets/AI-ModelScope/LaTeX_OCR/summary。模型地址:https://huggingface.co/Qwen/Qwen2.5-VL-7B-Instruct。这个数据集标注一塌糊涂啊,准确率太低了,还是没有商用的好,除非谁出资用商用的模型把这个数据集标注一下。全量微调Qwen2.5-VL-7B-Instruct的参数,用于图片转公式LaTex。后续就不写了,这数据集没法用。

2025-04-07 16:19:05 186

原创 vllm 离线推理Qwen2.5-VL-Instruct,API部署,支持max_pixels

使用这里的最新镜像:启动环境more。

2025-03-24 11:11:05 206

原创 免费论文aigc降重方法,AIGC降重提示词,优秀降重

在下面这个提示词里,加上三千字你那个领域的一些正常人说话的材料,可以去书籍里找找或者自己以前写过的文字材料,以前没AI的时候是怎么说话的就加这里。然后把这个提示词给腾讯元宝里的DeppSeekR1,你就可以得到降重后的文章。只有DeppSeekR1有这么优秀的理解模仿能力,或者找o1。网上的提示词都很低能,我这里介绍一个我使用的思路。降重网站写的材料都太弱智了。然后把提示词最后加上你想要改写的文字,不能太多,建议一小节一小节给入。思路很简单,让AI模仿你的真实说话风格,比如你的用词和句式。

2025-03-18 10:51:31 484

原创 LLaMA-Factory多机多卡训练实战

参考资料:https://llamafactory.readthedocs.io/zh-cn/latest/advanced/distributed.html以训练qwen2.5vl 7b 为例子。more。

2025-03-17 21:30:41 532

原创 LLaMA-Factory微调sft Qwen2.5-VL-7B-Instruct

"content": "你是一个擅长识别印章上文字的助手,输出json字符串给用户。",},"content": "<image>识别图片里红色印章上的公司名称或单位名称(印章主文字)。",},"content": "{\"印章主文字\": \"饮酒太原近似收益有限公司\"}",],"seal": {},"tags": {

2025-03-17 11:23:49 1385

原创 MSP430 Proteus 仿真作品

单片机的 P1.4~P1.7 接 4 个开关 s0~s3,P1.0~P1.3 接 4 个发光二极管 LED0~LED3。个相应的发光二极管的状态,例如 P1.4 引脚上开关 S0 的状态,由 P1.0 脚上的 LED0 显示;本题目中 ADC0809 的参考电压为+5V,根据定义,当接在单片机 P1.0、P1.1、P1.5 和 P1.6 脚开关都闭合时,SWl 开关接 5V 时,右转弯灯闪亮,74LS245 是缓冲驱动器,作为扩展的输人口,它的 8 个输入端分别接 8 个开关 K7~K0。

2025-03-16 20:07:30 855

原创 x012-MSP430F249智能步进电动百叶窗_proteus_光敏电阻_步进电机_仿真

系统通过步进电机驱动叶片旋转,集成光敏传感器检测环境光强,具备手动/自动双模式切换、角度限位保护、实时数据显示等功能。设计一个光检测器,用 LED/LCD 显示光强度值(这个要外接光线感应器,或者用按键模。• LCD双行显示:首行显示当前角度(ANG),次行自动模式下显示光强值(LUX)设置按键: 手动/自动切换、手动正转和手动反转,停止/启动键。• 5个功能按键:模式切换/正转/反转/启停/参数设置。当正转到极限位置时,电机停止正转,但还可以反转;当反转到极限位置时,电机停止反转,但还可以正转。

2025-03-16 20:04:42 458

原创 RustDesk自建远程桌面服务教程

有几家非要收钱,不收钱就慢得要死,自建一个自己用肯定就快了。more。

2025-03-15 17:51:55 516

原创 解析GNGGA数据,C语言单片机

这段GPS数据表明设备在UTC时间13:03:33.000时,位于北纬41.723942度、东经123.482748度,海拔93.1米的位置,使用了14颗卫星进行定位,水平定位精度优秀(HDOP=1.2),定位质量为标准GPS定位(Fix Quality=1)。• 表示大地水准面高度(Geoid Height),即实际地球表面与参考椭球面之间的高度差,单位为米。• 表示GPS数据记录的时间,以UTC(协调世界时)格式显示,具体为13时03分33秒000毫秒。• 此处为1,表示标准GPS定位。

2025-03-13 20:15:43 182

原创 ControlNet Reference模型:reference_adain、reference_adain+attn与reference_only的区别与应用场景解析

预处理器核心机制特点适用场景AdaIN(风格迁移)注重整体风格迁移,颜色和风格变化明显需要风格迁移,如将照片转换为二次元风格AdaIN + 注意力机制精细控制细节,风格和细节高度匹配需要高度细节匹配,如线稿转换为完整图像直接参考图像保留参考图风格,生成内容略有变化快速生成与参考图风格一致的图像。

2025-03-13 10:54:18 417

原创 使用 crontab 定时同步服务器文件到本地

是一个可以自动输入密码的工具。• 确保任务路径正确,使用绝对路径。文件,确认任务是否执行成功。替换为您的 SSH 密码。替换为您的 SSH 密码。等待 15:00 后,检查。假设您需要将远程服务器的。• 查看日志文件(如。

2025-03-11 14:39:15 526

原创 gitea 部署,mysql, 私人Git仓库

在cf上设置一个域名指向服务器IP。

2025-03-11 11:57:06 574

原创 使用mergekit合并大型语言模型

SLERP(球面线性插值)SLERP是一种在两个向量之间平滑插值的方法,适用于高维空间中的向量插值。它能够保持向量的几何特性,避免线性插值带来的向量长度缩减问题。slices:- sources:t:TIES(任务特定模型合并)TIES-Merging通过消除冗余参数和解决参数符号冲突,将多个任务特定模型合并为一个多任务模型。models:DARE(随机权重重置与重缩放)DARE通过随机重置微调权重并重缩放权重,将多个模型合并为一个。models:Passthrough(层拼接)

2025-03-06 10:35:32 611

原创 Copilot替代品代码补全插件——免费的CodeGPT——如何调用自己的大模型API

痛点与解决方案作为开发者,你是否因Copilot的高昂费用而犹豫?别担心,今天为大家推荐一款完全免费的替代方案——CodeGPT!它不仅支持代码智能补全,更可自定义接入私有化大模型API,实现个性化开发体验。本文手把手教你如何配置CodeGPT插件,打造专属AI编程助手。more。

2025-03-05 16:35:47 778

原创 LiteLLM 做大模型API接口Proxy转发

确实好用,简单易用。more。

2025-03-05 16:11:48 415

原创 EMQX MQTT Broker Docker部署

集群概览集群概览是指 EMQX 集群的总体状态和健康状况。通过集群概览,您可以查看集群中各个节点的运行状态、负载情况、连接数等信息。这对于监控和管理整个集群的运行情况非常重要。客户端客户端是指连接到 EMQX 服务器的 MQTT 客户端设备。每个客户端都有一个唯一的客户端标识符(Client ID),并且可以发布消息、订阅主题以及接收消息。EMQX 服务器会管理这些客户端的连接状态、会话信息等。订阅管理订阅管理是指对客户端订阅的主题进行管理。客户端可以订阅一个或多个主题,以接收发布到这些主题的消息。

2025-03-04 16:57:19 1015

原创 VLM-R1 实战训练教程

指定使用 bfloat16 数据类型进行训练,以更好地利用 GPU 的计算能力。这里设置为 false。: 指定梯度积累的步数,即在执行反向传播之前累积的梯度步数。: 指定 master 节点的地址,用于分布式训练的通信。: 指定生成模型输入的最大 prompt 长度。: 指定仅保存模型权重,不保存优化器状态等信息。: 指定当前节点的排名,这里是0号节点。: 指定每个设备上的训练批次大小为 1。: 指定 master 节点的端口号。: 指定每个节点上的进程数为 8。: 指定每个输入生成的输出序列数。

2025-03-03 16:02:29 1060 2

原创 大夏龙雀科技4G Cat1 CT511-AT0 MQTT联网实战教程

通过本教程,您已经成功配置并连接了大夏龙雀科技4G Cat1 CT511-AT0模块到MQTT服务器,并进行了消息的订阅和发布。希望本教程对您的开发工作有所帮助。

2025-03-01 11:19:57 1460 1

原创 阶跃星辰 Step-Vedio-T2V Docker 推理

moreStep-Video-T2V是一款由StepFun团队发布的最先进(SoTA)的文本生成视频预训练模型。该模型拥有300(即30B)亿参数,并能生成长达204帧的视频。其核心技术包括深度压缩的视频变分自编码器(Video-VAE)、3D完全注意力机制的DiT架构、中英双语预训练的文本编码器、人类偏好优化(DPO)技术。该模型在专门设计的视频生成基准测试Step-Video-T2V-Eval上表现卓越,全面超越其他开源和商业引擎。

2025-02-24 17:27:06 935

原创 DeepSeek 系列论文解读

*2024 年 1 月发布。提出新的缩放分配策略。结合**DeepSeekMoE**(更细粒度的专家,共享/路由结构)和**多头潜在注意力(MLA)**,通过减少KV缓存实现高效推理。- **数学/代码:** MATH-500(90.2% EM),LiveCodeBench(40.5% Pass@1),Codeforces(51.6%ile)。- **多步学习率调度分布**:训练初期2000步内达到最大值,然后80%的训练token之后减少到31.6%,接着到达90%的token时减少到10%。

2025-02-19 16:15:24 576

原创 Grok-3核心简报

Grok-3核心简报:【产品特性】【技术亮点】【实测表现】【战略定位】

2025-02-18 15:15:45 236

原创 使用AI大模型进行网页翻译

这个插件:more。

2025-02-14 17:21:10 278

原创 【LLM】由LayerNorm向RMSNorm

归一化层作为深度神经网络的核心组件,直接影响模型的训练动力学与泛化能力。本文从数学推导与计算图视角系统解析LayerNorm与RMSNorm的算法差异,结合Transformer架构演进规律,揭示大语言模型时代归一化技术的工程选择策略。通过理论分析与实验数据交叉验证,阐明RMSNorm在百亿参数级模型中的性能优势及其物理意义。more。

2025-02-13 17:03:00 79

原创 自抗扰控制(ADRC)代码,带宽法,控制倒立摆

自抗扰控制(Active Disturbance Rejection Control)由韩京清教授提出,其核心思想是将系统内外部的扰动统一视为"总扰动",通过扩张状态观测器实时估计并补偿。:生成过渡过程并提取微分信号:实时估计系统状态和总扰动:综合误差生成控制量。

2025-02-13 15:12:43 269

原创 OpenWebUI使用DeepSeek R1满血版,DeepSeek R1 API调用

可以自己修改一个模型名称便于认识,然后这个函数就可以显示出思考过程了。

2025-02-12 18:08:59 2083 1

原创 pix2pix mmgeneration通用场景黑白图片上色模型训练,Docker

more。

2025-01-17 15:07:59 345

原创 Android Java Ubuntu系统如何编译出 libopencv_java4.so

【代码】Android Java Ubuntu系统如何编译出 libopencv_java4.so。

2024-12-20 13:48:50 318

原创 gxdx-单片机实验-呼吸灯-stm32 Proteus仿真

more。

2024-11-28 14:16:42 479

原创 sglang 部署Qwen2VL7B,大模型部署,速度测试,深度学习

图来源:https://lmsys.org/blog/2024-09-04-sglang-v0-3/纯transformer,不用加速框架,我之前的测了一张图的速度是:5.22 seconds,很慢。

2024-11-18 15:05:13 2587

原创 背景移除,主体物抠图模型 RMBG-2.0:最佳一键去背景模型

准确性:高精度地分离前景和背景。效率:优化以实现快速推理时间。多功能性:在各种图像类别(包括通用股票图片、电子商务、游戏和广告内容)中表现良好。内容安全:确保生成的内容安全且适当。合法授权的数据集:训练数据完全合法,避免法律问题。偏见缓解:训练数据中平衡了性别、种族和残疾人的代表性。

2024-11-14 10:04:23 834

原创 ollama Docker部署 Qwen2.5-Coder-32B-Instruct

【代码】ollama Docker部署 Qwen2.5-Coder-32B-Instruct。

2024-11-13 13:43:00 585

单片机教案 MSP430G2553教学

单片机教案 MSP430G2553教学

2020-07-05

DSP2833x_Libraries 开发库函数

DSP2833x_Libraries 开发库函数

2020-06-29

22-有农历和闹钟 单片机实物制作 51单片机 全套资料

22-有农历和闹钟 单片机实物制作 51单片机 全套资料

2020-06-26

STM32C8T6 核心板原理图V2.zip

STM32C8T6 核心板原理图V2.zip

2020-06-26

心率计(心跳测量仪) 全套资料 51单片机

心率计(心跳测量仪) 全套资料 51单片机

2020-06-26

004---基于stm32电压表设计(数码管显示).rar

004---基于stm32电压表设计(数码管显示).rar

2020-04-19

纸张计数全部资料.zip

纸张计数 代码 原理图 单片机 赛题

2020-03-14

12、红外点滴输液检测系统 51单片机

12、红外点滴输液检测系统 51单片机

2020-03-06

51单片机 示波器 LCD12864 淘宝资料 论文 淘宝爆款

51单片机 示波器 LCD12864 淘宝资料 论文 淘宝爆款51单片机 示波器 LCD12864 淘宝资料 论文 淘宝爆款51单片机 示波器 LCD12864 淘宝资料 论文 淘宝爆款51单片机 示波器 LCD12864 淘宝资料 论文 淘宝爆款

2020-01-19

stc15模板串口OLEDDHT11.zip

stc15模板串口OLEDDHT11.zip

2019-12-23

STM32F103VET6 正点原子 移植 模板 ,模仿正点原子工程

STM32F103VET6 模仿正点原子工程。 移植 模板 STM32F103VET6 正点原子 移植 模板

2019-12-17

12864 万年历 单片机

12864 万年历带字库12864 万年历

2019-12-06

LCD12864 万年历 单片机 农历 显示 温度DS18B20 DS1302 AT24C02

全套代码,仿真。显示界面非常漂亮。LCD12864 万年历 单片机 农历 显示 温度DS18B20 DS1302 AT24C02LCD12864

2019-12-05

STM32F103RCT6 PCB 原理图 打板 原子 mini

STM32F103RCT6 PCB 原理图 打板 原子 miniSTM32F103RCT6 PCB 原理图 打板 原子 miniSTM32F103RCT6 PCB 原理图 打板 原子 mini

2019-11-29

TI tiva tm4C ARM 库函数手册

TI tiva tm4C ARM 库函数手册TI tiva tm4C ARM 库函数手册TI tiva tm4C ARM 库函数手册TI tiva tm4C ARM 库函数手册TI tiva tm4C ARM 库函数手册TI tiva tm4C ARM 库函数手册TI tiva tm4C ARM 库函数手册

2019-11-26

STM32F103C8T6 工程模板 模仿 正点原子

STM32F103C8T6 工程模板 模仿 正点原子

2019-10-14

L EDIT 绘制多边形 绘制文字 C代码

L EDIT 绘制多边形 绘制文字 C代码

2019-09-30

android P 9.0 支持HTTP

android P 9.0 支持HTTP,博客 https://blog.csdn.net/x1131230123/article/details/101384870

2019-09-25

猫狗大战得到的模型.zip

博客地址:https://blog.csdn.net/x1131230123/article/details/100900137

2019-09-20

PIC16F887 官方文档 用户手册 另加2个仿真例程 LCD1602 矩阵键盘 拨号 计算器 音乐盒

安装环境参加这个博客:https://blog.csdn.net/x1131230123/article/details/100907773。 压缩包里面是用户手册,还有2个例程。 LCD1602 矩阵键盘 拨号 计算器 音乐盒。

2019-09-19

花式流水实验 仿真 proteus8.6

花式流水实验 仿真 proteus8.6

2019-09-18

kaggle 猫狗数据集二分类 系列(1)构建模型进行二分类,保存模型,画出走势图 代码

博客 https://blog.csdn.net/x1131230123/article/details/100900137 代码

2019-09-16

波士顿房价 keras 深度学习 回归程序

波士顿房价 keras 深度学习 回归程序

2019-09-15

avr MEGA16 DS1302 LCD1602 万年历 时钟显示 proeus 仿真 + 程序

仿真 程序 avr MEGA16 DS1302 LCD1602 万年历 时钟显示 proeus 仿真avr MEGA16 DS1302 LCD1602 万年历 时钟显示 proeus 仿真avr MEGA16 DS1302 LCD1602 万年历 时钟显示 proeus 仿真

2019-09-11

AD9952 设计 资料 代码 原理图 DDS 扫频 定频

AD9952 设计 资料 代码 原理图 DDS 扫频 定频

2019-08-12

简易多功能液体容器 K题 2019 电子设计大赛 电赛 方案 材料清单

简易多功能液体容器 K题 2019 电子设计大赛 电赛 方案 材料清单

2019-08-07

2019 电子设计大赛 电赛 全部赛题

2019 电子设计大赛 电赛 全部赛题

2019-08-07

2019 电子设计大赛 电赛 预测 分析

2019 电子设计大赛 电赛 预测 分析2019 电子设计大赛 电赛 预测 分析

2019-08-05

深度学习clip-interrogator clip docker 容器启动过程

【深度学习】clip-interrogator clip docker 容器启动过程

2023-09-20

C++用纯逻辑判断合并OCR的本文行为文本段落

C++用纯逻辑判断合并OCR的本文行为文本段落

2023-06-13

Gitxmind GIt bash 使用 xmind

Gitxmind GIt bash 使用 xmindGitxmind GIt bash 使用 xmindGitxmind GIt bash 使用 xmindGitxmind GIt bash 使用 xmindGitxmind GIt bash 使用 xmindGitxmind GIt bash 使用 xmind

2021-07-11

SHT3x_Datasheet_digital英文手册.pdf

SHT3x_Datasheet_digital英文手册.pdfSHT3x_Datasheet_digital英文手册.pdfSHT3x_Datasheet_digital英文手册.pdfSHT3x_Datasheet_digital英文手册.pdfSHT3x_Datasheet_digital英文手册.pdf

2021-02-21

51单片机 普中V2 数字时钟 电子时钟 万年历 DS1302 LCD1602 AT24C02

51单片机 普中V2 数字时钟 电子时钟 万年历 DS1302 LCD1602 AT24C0251

2020-10-26

SSD1306 芯片数据手册 OLED驱动 用户手册

SSD1306 芯片数据手册 OLED驱动 用户手册

2020-09-20

STM32F103C8T6 单片机 ESP8266 12F接入机智云

STM32F103C8T6 单片机 ESP8266 12F接入机智云STM32F103C8T6 单片机 ESP8266 12F接入机智云STM32F103C8T6 单片机 ESP8266 12F接入机智云STM32F103C8T6 单片机 ESP8266 12F接入机智云

2020-09-05

msp430f5438 freeRTOS CCS工程

msp430f5438 freeRTOS CCS工程

2020-07-20

51单片机温湿度报警器 仿真

51单片机温湿度报警器 仿真

2020-07-18

proteus经典实例.zip

51单片机仿真 各种仿真资料 流水灯 显示屏 应有尽0

2020-07-13

MSP430F249 仿真实验 proteus

使用方法看博客 : https://editor.csdn.net/md?articleId=107315760

2020-07-13

工具软件 MSP430F149下载程序所需要用到的软件

教程 https://blog.csdn.net/x1131230123 工具软件 MSP430F149下载程序所需要用到的软件工具软件

2020-07-05

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除