一、加速 LoRA 实战案例
SD1.5 模型 + LCM LoRA
操作步骤:
- 加载 SD1.5 基础模型。
- 插入 LoraLoader 节点。
- 选择 LCM-LoRA 文件(如
lcm-lora-sdv1-5.safetensors
)。 - 设置采样器为 LCM,Scheduler 为
sgm_uniform
。 - 将采样步数从 30 降至 12。
效果对比:
- 未使用 LCM 时,12 步生成图片模糊、细节丢失。
- 使用后,同等步数下画面清晰,但纹理精细度下降约 20%。
SDXL 模型 + Lightning LoRA
案例配置:
- 在 SDXL 生成流程中,插入 LoraLoader 加载
lightning-sdxl-lora.safetensors
。 - 采样器保持
euler
,步数设置为 8。
结果:
- 角色图生成时间从 18 秒缩短至 7 秒。
- 肢体变形率降低 50%(对比 Turbo LoRA)。
二、节点结构优化案例
CLIP 编码器拆分
问题:
- 默认 CLIP 节点同时处理正/负提示词,导致模型重复加载。
优化方案:
- 将单一 CLIP 节点拆分为两个独立节点,分别连接正向和负向提示词输入。
- 通过
CLIPTextEncodeSDXL
节点适配 SDXL 模型层级。
实测效果:
- 文本编码阶段耗时减少 30%,尤其适用于长文本输入(如 300 字以上提示词)。
TeaCache 缓存加速
操作流程:
- 在 K 采样器(如
KSamplerAdvanced
)前插入 TeaCache 节点。 - 选择缓存模式为「无损加速」。
- 设置时间步差异阈值为 0.05。
数据对比:
- 30 步 SDXL 生图时间从 16 秒降至 10 秒。
- 搭配 ControlNet 时仍保持 85% 以上骨骼精度。
三、工作流优化实例
角色设计加速工作流
textCopy CodeCheckpoint加载 → CLIP拆分 → Lightning-LoRA → TeaCache → KSampler(8步)
↘ ControlNet(Openpose)↗
参数设置:
- 采样器:
euler
- Scheduler:
normal
- ControlNet 强度:0.6
- TeaCache 模式:质量优先
效率提升:
- 生成 1024x1024 角色图仅需 6 秒(原流程需 15 秒)。
- 手部细节错误率从 25% 降至 8%。
四、关键参数避坑指南
SDXL 必关项
- 检查工作流中是否存在
CLIP Set Last Layer
节点,若存在则直接删除,避免因层级冲突导致生成速度下降 40%。
LoRA 强度设置
- Lightning LoRA 建议权重 0.8-1.0。
- Turbo LoRA 需降至 0.6-0.8 以减少肢体变形。
缓存阈值选择
- TeaCache 差异阈值 >0.1 时可能丢失发丝细节。
- 建议角色图使用 0.02-0.05,场景图可用 0.08-0.1。
通过上述案例组合优化,可实现 SDXL 模型 8 秒出图(1024x1024)、SD1.5 模型 5 秒出图(512x768),且保持可用质量。具体参数需根据硬件配置(如显存大小)微调。