- 博客(1710)
- 资源 (125)
- 收藏
- 关注
原创 VLM Qwen2.5VL GRPO训练微调 EasyR1 多机多卡训练(2)
脚本首先设置分布式训练参数(如节点数、GPU数量、主节点IP等),然后根据当前节点的RANK值区分主节点和工作节点:主节点启动Ray head服务并等待所有工作节点连接,工作节点则连接到主节点。当集群就绪后,主节点会启动训练脚本(qwen2_5_vl_7b_grpo_train.sh),同时集成了SwanLab实验跟踪工具,支持云端和本地训练日志记录。verl 依托于 Ray, 所以多机多卡使用需要使用Ray进行训练,Ray和torchrun的原理也差不多。
2025-05-02 16:09:02
91
原创 VLM-R1 训练:max_anyres_num 参数与多图处理机制解析
通过这次深入分析,我们了解到是控制 InternVL 图像分块数量、平衡细节与资源消耗的关键参数,合理调整它可以有效缓解显存压力。同时,我们也确认了 VLM-R1 框架具备完善的多图像样本处理能力。希望这些信息能帮助大家在训练自己的多模态模型时,更加得心应手!
2025-05-01 17:06:42
97
原创 如何强制关闭Qwen/Qwen3的思考功能
也就相当于enable_thinking参数你传不传这里都是默认enable_thinking就是false,模板永远给空。在之前的文章里,教学了部署和请求的时候去给参数从而关闭thinking:https://www.dong-blog.fun/post/2053。翻译出来就是,如果enable_thinking被定义了,而且enable_thinking参数是false,那么think直接给空。但是还是麻烦,能不能默认就把这个thinking给关闭,从代码层面直接关闭?
2025-04-30 11:45:36
123
原创 使用 Ziegler-Nichols 法进行 PID 参数整定:实践指南
Ziegler-Nichols 方法是一种基于系统临界响应的实验整定方法,由 John G. Ziegler 和 Nathaniel B. Nichols 在 20 世纪 40 年代提出。该方法无需对系统进行复杂的数学建模,适用于大多数线性或近似线性的动态系统。Ziegler-Nichols 方法是一种经典的 PID 参数整定手段,尤其适用于缺乏精确系统模型或需快速部署控制算法的场景。虽然它不能保证最优性能,但提供了一个良好的起点。
2025-04-29 11:17:37
1032
原创 利用EMQX实现单片机和PyQt的数据MQTT互联
本文将介绍一个基于MQTT协议的设备监控与控制系统,该系统由两部分组成:模拟单片机设备和PyQt客户端。系统运行后,设备模拟器会每2秒发送一次GPS数据,PyQt客户端会实时显示这些数据,并可通过按钮或自定义文本发送控制命令。设备模拟器使用随机生成的GPS坐标数据,模拟设备移动的场景,同时能够对不同类型的命令做出响应。该系统基于发布-订阅模式,采用MQTT协议实现设备与客户端之间的双向通信。这种设计解决了MQTT回调线程与GUI线程的冲突问题,确保了应用程序的稳定性。):客户端向此主题发布控制命令。
2025-04-28 17:37:52
854
原创 InternVL 3的技术深度分析,代码与原理
我将对InternVL 3进行更深入的技术分析,结合代码和公式来详细阐述其核心技术、训练方法和推理部署。
2025-04-18 18:54:04
114
原创 VMware Ubuntu挂载Windows机器的共享文件
通过以上步骤,您可以在VMware Ubuntu中无缝访问Windows共享文件夹。这种方法比其他文件传输方式更高效,特别适合需要频繁在两个系统间编辑同一文件的场景。记住,安全起见,建议使用凭证文件而非直接在命令行中输入密码,并确保共享设置仅允许必要的最小权限。
2025-04-15 17:07:49
802
原创 Stable Diffusion:使用ControlNet为黑白照片上色
用途:专为黑白照片上色设计的轻量化模型核心特点• 老照片修复/历史影像彩色化的理想选择• 基于ControlNet架构,采用LoRA(低秩适应)技术实现模型瘦身:• 原版ControlNet:4.7GB → Control-LoRA:仅738MB/377MB• 训练时覆盖多样化图像概念和比例,具备优秀泛化能力HuggingFace项目页more。
2025-04-11 09:48:31
1165
原创 Qwen 2.5 VL 图片转公式,微调实战教学
数据集:https://modelscope.cn/datasets/AI-ModelScope/LaTeX_OCR/summary。模型地址:https://huggingface.co/Qwen/Qwen2.5-VL-7B-Instruct。这个数据集标注一塌糊涂啊,准确率太低了,还是没有商用的好,除非谁出资用商用的模型把这个数据集标注一下。全量微调Qwen2.5-VL-7B-Instruct的参数,用于图片转公式LaTex。后续就不写了,这数据集没法用。
2025-04-07 16:19:05
186
原创 免费论文aigc降重方法,AIGC降重提示词,优秀降重
在下面这个提示词里,加上三千字你那个领域的一些正常人说话的材料,可以去书籍里找找或者自己以前写过的文字材料,以前没AI的时候是怎么说话的就加这里。然后把这个提示词给腾讯元宝里的DeppSeekR1,你就可以得到降重后的文章。只有DeppSeekR1有这么优秀的理解模仿能力,或者找o1。网上的提示词都很低能,我这里介绍一个我使用的思路。降重网站写的材料都太弱智了。然后把提示词最后加上你想要改写的文字,不能太多,建议一小节一小节给入。思路很简单,让AI模仿你的真实说话风格,比如你的用词和句式。
2025-03-18 10:51:31
484
原创 LLaMA-Factory多机多卡训练实战
参考资料:https://llamafactory.readthedocs.io/zh-cn/latest/advanced/distributed.html以训练qwen2.5vl 7b 为例子。more。
2025-03-17 21:30:41
532
原创 LLaMA-Factory微调sft Qwen2.5-VL-7B-Instruct
"content": "你是一个擅长识别印章上文字的助手,输出json字符串给用户。",},"content": "<image>识别图片里红色印章上的公司名称或单位名称(印章主文字)。",},"content": "{\"印章主文字\": \"饮酒太原近似收益有限公司\"}",],"seal": {},"tags": {
2025-03-17 11:23:49
1385
原创 MSP430 Proteus 仿真作品
单片机的 P1.4~P1.7 接 4 个开关 s0~s3,P1.0~P1.3 接 4 个发光二极管 LED0~LED3。个相应的发光二极管的状态,例如 P1.4 引脚上开关 S0 的状态,由 P1.0 脚上的 LED0 显示;本题目中 ADC0809 的参考电压为+5V,根据定义,当接在单片机 P1.0、P1.1、P1.5 和 P1.6 脚开关都闭合时,SWl 开关接 5V 时,右转弯灯闪亮,74LS245 是缓冲驱动器,作为扩展的输人口,它的 8 个输入端分别接 8 个开关 K7~K0。
2025-03-16 20:07:30
855
原创 x012-MSP430F249智能步进电动百叶窗_proteus_光敏电阻_步进电机_仿真
系统通过步进电机驱动叶片旋转,集成光敏传感器检测环境光强,具备手动/自动双模式切换、角度限位保护、实时数据显示等功能。设计一个光检测器,用 LED/LCD 显示光强度值(这个要外接光线感应器,或者用按键模。• LCD双行显示:首行显示当前角度(ANG),次行自动模式下显示光强值(LUX)设置按键: 手动/自动切换、手动正转和手动反转,停止/启动键。• 5个功能按键:模式切换/正转/反转/启停/参数设置。当正转到极限位置时,电机停止正转,但还可以反转;当反转到极限位置时,电机停止反转,但还可以正转。
2025-03-16 20:04:42
458
原创 解析GNGGA数据,C语言单片机
这段GPS数据表明设备在UTC时间13:03:33.000时,位于北纬41.723942度、东经123.482748度,海拔93.1米的位置,使用了14颗卫星进行定位,水平定位精度优秀(HDOP=1.2),定位质量为标准GPS定位(Fix Quality=1)。• 表示大地水准面高度(Geoid Height),即实际地球表面与参考椭球面之间的高度差,单位为米。• 表示GPS数据记录的时间,以UTC(协调世界时)格式显示,具体为13时03分33秒000毫秒。• 此处为1,表示标准GPS定位。
2025-03-13 20:15:43
182
原创 ControlNet Reference模型:reference_adain、reference_adain+attn与reference_only的区别与应用场景解析
预处理器核心机制特点适用场景AdaIN(风格迁移)注重整体风格迁移,颜色和风格变化明显需要风格迁移,如将照片转换为二次元风格AdaIN + 注意力机制精细控制细节,风格和细节高度匹配需要高度细节匹配,如线稿转换为完整图像直接参考图像保留参考图风格,生成内容略有变化快速生成与参考图风格一致的图像。
2025-03-13 10:54:18
417
原创 使用 crontab 定时同步服务器文件到本地
是一个可以自动输入密码的工具。• 确保任务路径正确,使用绝对路径。文件,确认任务是否执行成功。替换为您的 SSH 密码。替换为您的 SSH 密码。等待 15:00 后,检查。假设您需要将远程服务器的。• 查看日志文件(如。
2025-03-11 14:39:15
526
原创 使用mergekit合并大型语言模型
SLERP(球面线性插值)SLERP是一种在两个向量之间平滑插值的方法,适用于高维空间中的向量插值。它能够保持向量的几何特性,避免线性插值带来的向量长度缩减问题。slices:- sources:t:TIES(任务特定模型合并)TIES-Merging通过消除冗余参数和解决参数符号冲突,将多个任务特定模型合并为一个多任务模型。models:DARE(随机权重重置与重缩放)DARE通过随机重置微调权重并重缩放权重,将多个模型合并为一个。models:Passthrough(层拼接)
2025-03-06 10:35:32
611
原创 Copilot替代品代码补全插件——免费的CodeGPT——如何调用自己的大模型API
痛点与解决方案作为开发者,你是否因Copilot的高昂费用而犹豫?别担心,今天为大家推荐一款完全免费的替代方案——CodeGPT!它不仅支持代码智能补全,更可自定义接入私有化大模型API,实现个性化开发体验。本文手把手教你如何配置CodeGPT插件,打造专属AI编程助手。more。
2025-03-05 16:35:47
778
原创 EMQX MQTT Broker Docker部署
集群概览集群概览是指 EMQX 集群的总体状态和健康状况。通过集群概览,您可以查看集群中各个节点的运行状态、负载情况、连接数等信息。这对于监控和管理整个集群的运行情况非常重要。客户端客户端是指连接到 EMQX 服务器的 MQTT 客户端设备。每个客户端都有一个唯一的客户端标识符(Client ID),并且可以发布消息、订阅主题以及接收消息。EMQX 服务器会管理这些客户端的连接状态、会话信息等。订阅管理订阅管理是指对客户端订阅的主题进行管理。客户端可以订阅一个或多个主题,以接收发布到这些主题的消息。
2025-03-04 16:57:19
1015
原创 VLM-R1 实战训练教程
指定使用 bfloat16 数据类型进行训练,以更好地利用 GPU 的计算能力。这里设置为 false。: 指定梯度积累的步数,即在执行反向传播之前累积的梯度步数。: 指定 master 节点的地址,用于分布式训练的通信。: 指定生成模型输入的最大 prompt 长度。: 指定仅保存模型权重,不保存优化器状态等信息。: 指定当前节点的排名,这里是0号节点。: 指定每个设备上的训练批次大小为 1。: 指定 master 节点的端口号。: 指定每个节点上的进程数为 8。: 指定每个输入生成的输出序列数。
2025-03-03 16:02:29
1060
2
原创 大夏龙雀科技4G Cat1 CT511-AT0 MQTT联网实战教程
通过本教程,您已经成功配置并连接了大夏龙雀科技4G Cat1 CT511-AT0模块到MQTT服务器,并进行了消息的订阅和发布。希望本教程对您的开发工作有所帮助。
2025-03-01 11:19:57
1460
1
原创 阶跃星辰 Step-Vedio-T2V Docker 推理
moreStep-Video-T2V是一款由StepFun团队发布的最先进(SoTA)的文本生成视频预训练模型。该模型拥有300(即30B)亿参数,并能生成长达204帧的视频。其核心技术包括深度压缩的视频变分自编码器(Video-VAE)、3D完全注意力机制的DiT架构、中英双语预训练的文本编码器、人类偏好优化(DPO)技术。该模型在专门设计的视频生成基准测试Step-Video-T2V-Eval上表现卓越,全面超越其他开源和商业引擎。
2025-02-24 17:27:06
935
原创 DeepSeek 系列论文解读
*2024 年 1 月发布。提出新的缩放分配策略。结合**DeepSeekMoE**(更细粒度的专家,共享/路由结构)和**多头潜在注意力(MLA)**,通过减少KV缓存实现高效推理。- **数学/代码:** MATH-500(90.2% EM),LiveCodeBench(40.5% Pass@1),Codeforces(51.6%ile)。- **多步学习率调度分布**:训练初期2000步内达到最大值,然后80%的训练token之后减少到31.6%,接着到达90%的token时减少到10%。
2025-02-19 16:15:24
576
原创 【LLM】由LayerNorm向RMSNorm
归一化层作为深度神经网络的核心组件,直接影响模型的训练动力学与泛化能力。本文从数学推导与计算图视角系统解析LayerNorm与RMSNorm的算法差异,结合Transformer架构演进规律,揭示大语言模型时代归一化技术的工程选择策略。通过理论分析与实验数据交叉验证,阐明RMSNorm在百亿参数级模型中的性能优势及其物理意义。more。
2025-02-13 17:03:00
79
原创 自抗扰控制(ADRC)代码,带宽法,控制倒立摆
自抗扰控制(Active Disturbance Rejection Control)由韩京清教授提出,其核心思想是将系统内外部的扰动统一视为"总扰动",通过扩张状态观测器实时估计并补偿。:生成过渡过程并提取微分信号:实时估计系统状态和总扰动:综合误差生成控制量。
2025-02-13 15:12:43
269
原创 OpenWebUI使用DeepSeek R1满血版,DeepSeek R1 API调用
可以自己修改一个模型名称便于认识,然后这个函数就可以显示出思考过程了。
2025-02-12 18:08:59
2083
1
原创 Android Java Ubuntu系统如何编译出 libopencv_java4.so
【代码】Android Java Ubuntu系统如何编译出 libopencv_java4.so。
2024-12-20 13:48:50
318
原创 sglang 部署Qwen2VL7B,大模型部署,速度测试,深度学习
图来源:https://lmsys.org/blog/2024-09-04-sglang-v0-3/纯transformer,不用加速框架,我之前的测了一张图的速度是:5.22 seconds,很慢。
2024-11-18 15:05:13
2587
原创 背景移除,主体物抠图模型 RMBG-2.0:最佳一键去背景模型
准确性:高精度地分离前景和背景。效率:优化以实现快速推理时间。多功能性:在各种图像类别(包括通用股票图片、电子商务、游戏和广告内容)中表现良好。内容安全:确保生成的内容安全且适当。合法授权的数据集:训练数据完全合法,避免法律问题。偏见缓解:训练数据中平衡了性别、种族和残疾人的代表性。
2024-11-14 10:04:23
834
原创 ollama Docker部署 Qwen2.5-Coder-32B-Instruct
【代码】ollama Docker部署 Qwen2.5-Coder-32B-Instruct。
2024-11-13 13:43:00
585
51单片机 示波器 LCD12864 淘宝资料 论文 淘宝爆款
2020-01-19
STM32F103VET6 正点原子 移植 模板 ,模仿正点原子工程
2019-12-17
LCD12864 万年历 单片机 农历 显示 温度DS18B20 DS1302 AT24C02
2019-12-05
STM32F103RCT6 PCB 原理图 打板 原子 mini
2019-11-29
TI tiva tm4C ARM 库函数手册
2019-11-26
android P 9.0 支持HTTP
2019-09-25
PIC16F887 官方文档 用户手册 另加2个仿真例程 LCD1602 矩阵键盘 拨号 计算器 音乐盒
2019-09-19
kaggle 猫狗数据集二分类 系列(1)构建模型进行二分类,保存模型,画出走势图 代码
2019-09-16
avr MEGA16 DS1302 LCD1602 万年历 时钟显示 proeus 仿真 + 程序
2019-09-11
Gitxmind GIt bash 使用 xmind
2021-07-11
SHT3x_Datasheet_digital英文手册.pdf
2021-02-21
51单片机 普中V2 数字时钟 电子时钟 万年历 DS1302 LCD1602 AT24C02
2020-10-26
STM32F103C8T6 单片机 ESP8266 12F接入机智云
2020-09-05
工具软件 MSP430F149下载程序所需要用到的软件
2020-07-05
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人