- 博客(149)
- 资源 (5)
- 收藏
- 关注
原创 抛弃 ControlNet,这些 Flux Tools 工作流你值得拥有
FLUX.1 Fill:最先进的修复模型,结合文本提示词,可用于局部重绘和一键扩图。FLUX.1 Depth:基于深度图的结构,结合文本提示词,生成新的图片,实现Depth ControlNet的能力。FLUX.1 Canny:基于线稿图的结构,结合文本提示词,生成新的图片,实现Canny ControlNet的能力。FLUX.1 Redux:生成图片的变种或者说是风格迁移,实现类似 IPAdapter 的能力。
2024-12-04 12:34:11
1493
原创 ComfyUI 完全入门:反推提示词的四种方法
大家好,我是每天分享AI应用的萤火君!在AI绘画中提示词是一个很重要的方面,有效的提示词才能生成期望的图像。提示词就像是图像的引路灯,往往一个词就有化腐朽为神奇的力量。关于提示词的重要性,这里就不多说了,用过的同学应该都知道。这篇文章的主题是反推提示词。有时候我们看到一张图特别棒,想要模仿它的构图或者某些风格;又或者我们想要在重绘图像时保持图像的基本元素不变;再或者我们想要训练自己的模型,就需要给所有的训练图片打标。这些时候就需要反推提示词了。
2024-10-10 13:29:21
3187
1
原创 ComfyUI 高级实战:实现华为手机的AI消除功能
大家好,我是每天分享AI应用的萤火君!不知道大家是否还记得华为 Pura 70的「AI消除」事件,当时使用 华为Pura 70 系列手机的智能消除功能时,该功能可以被用来消除照片中女性胸口处的衣物,这一功能曾引发广泛的关注和伦理担忧,后来华为迅速修复了这一问题。这篇文章就来介绍如何通过 ComfyUI 来实现类似的涂抹消除功能,当然我们也会避免出现之前的争议问题。),但是经常出现画面融合不太好的问题,需要不断抽卡,本文使用的方法相较之前的普通处理方式会有很大的改善。
2024-10-10 13:27:41
1826
原创 ComfyUI 实战教程:古人画像变真人
大家好,我是每天分享AI应用的萤火君!最近看到一种古画变真人的效果,就是将书上的古人画像重绘为真人,效果炸裂,不敢独享,特别分享给大家。
2024-10-09 08:09:02
1003
原创 ComfyUI 高级实战:天鹅湖儿童写真
大家好,我是每天分享AI应用的萤火君!AI绘画在写真特别是儿童写真领域的应用比较广泛,这篇文章就来给大家介绍一个基于ComfyUI的儿童写真工作流,其中会用到一个天鹅湖的风格LoRA,所以称之为天鹅湖儿童写真。因为在ComfyUI工作流中,每个节点和参数的设置都可能对最终效果产生比较大的影响,所以我会尽量详细介绍其中每个节点的功能和用途,让大家能够举一反三,做出更好的作品。
2024-10-09 08:06:09
849
原创 ComfyUI 实战教程:模特换装/虚拟试衣
只需要一个人物的形象照片,服装的平铺照片,不需要手绘蒙版,一键就可以生成这个人物穿搭这件服装的效果图。
2024-09-23 08:12:51
1999
原创 Stable Diffusion WebUI Forge 支持 Flux 了!
大家好,我是每天分享AI应用的萤火君!Flux横空出世有段时间了,模型效果也得到了广泛的认可,但是 Stable Diffusion WebUI 官方迟迟没有跟进,据说是因为要修改很多底层的处理机制,加之ComfyUI如火如荼,可能越南大佬的心气也不是很高,选择了躺平,又或者是在秘密的憋大招。不过在开源的AI绘画界还有另一个大佬,那就是 ControlNet 的作者张吕敏,他搞了一个SD WebUI的衍生版:Stable Diffusion WebUI Forge。
2024-09-23 08:10:36
5101
2
原创 Flux持续火爆,这些LoRA、ControlNet、工作流你值得拥有
Flux是目前最大的AI绘画开源模型,有120亿个参数,原始文件有23GB那么大。听起来很吓人吧?但别担心,通过ComfyUI的支持,我们可以把模型压缩到12GB,并且它会自动检测显存来调整加载方式,这样我们在普通的消费级电脑上也能跑得动。Flux 在视觉效果、提示的准确性、大小和比例的灵活性、排版和输出多样性方面,比Midjourney v6.0、DALL·E 3 (HD) 和 SD3-Ultra这些流行模型都要好。它可以在256到2048的宽分辨率范围内生成高质量、少冗余的图像,四肢表现也非常稳定。
2024-09-05 17:40:11
1730
原创 极速体验媲美GPT4V的国产开源视觉大模型CogVLM2(赠书)
大家好,我是每天分享AI应用的萤火君!CogVLM2是一款视觉语言模型(Visual Language Model),由智谱AI和清华KEG潜心打磨。这款模型是CogVLM的升级版本,支持高达 1344 * 1344 的图像分辨率,提供支持 中英文双语 的开源模型版本。这类模型可以做很多跨领域的活儿,比如给图片配上描述文字、回答关于图片的问题(这叫VQA,就是视觉问答)、或者根据描述去找对应的图片等等。
2024-09-05 17:35:41
1069
原创 AI修复老照片的完整教程来了!
大家好,我是每天分享AI应用的萤火君!最近老照片修复的项目比较火爆,很多同学都拿到了成果,这个技术上已经没有太大的难度,结合各种工具可以做出不错的效果,但是很多人还不知道如何实现,这篇文章就来给大家分享下AI修复老照片的方式方法。本文主要介绍使用ComfyUI工作流修复老照片的方法,经过最近几天的研究,不仅可以修复普通的模糊老照片、也可以修复有污渍、划痕和破损的老照片。使用ComfyUI工作流,我们还可以做到:只上传一张老照片,然后一键修复,无需输入任何提示词。
2024-09-04 13:37:39
2377
原创 使用LLaMA-Factory快速训练自己的专用大模型
大家好,我是每天分享AI应用的萤火君!本文聊聊 LLama-Factory,它是一个开源框架,这里头可以找到一系列预制的组件和模板,让你不用从零开始,就能训练出自己的语言模型(微调)。不管是聊天机器人,还是文章生成器,甚至是问答系统,都能搞定。而且,LLama-Factory 还支持多种框架和数据集,这意味着你可以根据项目需求灵活选择,把精力集中在真正重要的事情上——创造价值。使用LLama-Factory,常见的就是训练LoRA模型,增强模型在某方面的生成能力。
2024-09-04 13:34:35
1677
原创 分享一个好用的印花重绘工具
本文向大家介绍一款革命性的 AI 工具,它能够将模糊不清的图片转化为具有照片级别的高清图像。这项前沿项目依托于大规模人工智能技术,革新了图像恢复领域。通过文本驱动和智能修复功能,它巧妙地结合了先进的 AI 技术与创新理念,为每一张图像注入新的生命与活力。该工具的核心能力在于其出色的重绘功能,在印花行业受到了极高的评价。这个工具目前已经发布在云平台上,赠送一些免费额度,有需要的同学不妨一试。
2024-08-05 12:36:24
669
原创 Stable Diffusion WebUI 1.10.0来了
大家好,我是每天分享AI应用的萤火君!前几天 AUTOMATIC1111 发布了Stable Diffusion WebUI 1.10,我也在第一时间将云环境的镜像升级到了最新版本,有兴趣的同学可以去体验下,目前已经发布到了AutoDL,镜像地址:这篇文章集中给大家介绍下SD WebUI 1.10的新功能和各项改进。
2024-08-05 12:25:08
1593
原创 ComfyUI 实战教程:一键扩图
大家好,我是每天分享AI应用的萤火君!本文给大家分享一个很有用的技术:AI扩图。所谓扩图就是扩展图像的边界,在图像的边界外新增更多画面元素,这不仅仅是扩大图像的尺寸,还要让新添加的部分与原有图像的内容自然融合。想想还是挺让人激动的,大家可能也有点等不及了,本文将使用 ComfyUI 工作流来实现AI扩图。
2024-08-02 12:27:43
2736
1
原创 ComfyUI 实战教程:图片添加文字
大家好,我是每天分享AI应用的萤火君!在AI绘画中书写文字一直是个老大难的问题,直到SDXL的出现,文字生成才迎来转机,可以在提示词中指定一些英文字符,不过也是经常出错,生成中文就更加不可求了。本文介绍一种在AI生成图片中稳定生成文字的方法,可以自定义字体、颜色、大小,以及文字书写方向,有兴趣的同学可以继续了解下。
2024-08-02 12:25:52
2409
原创 ComfyUI 完全入门:ControlNet
很多同学对ComfyUI可能还不太了解,我这里做一个简单的介绍。在AI绘画领域,Stable Diffusion 因其开源特性而受到广泛的关注和支持,背后聚拢了一大批的应用开发者和艺术创作者,是AI绘画领域当之无愧的王者。目前使用 Stable Diffusion 进行创作的工具主要有两个:Stable Diffusion WebUI 和 ComfyUI。
2024-06-21 08:23:19
1574
原创 SD3发布,送你3个ComfyUI工作流
SD3是一个多模态的 Diffusion Transformer 模型,这个模型有什么特点呢?多模态:这个词大家可能比较陌生,不过也很简单,就是一个模型中有多个子模型,它们分别处理不同方面的任务,让模型的整体能力更强。在SD3内部,模型先将文本和图像分为两个子模型,然后在后续的处理中又把它们连接起来。通过这种方法,允许图像和文本令牌之间的信息流动,以改善生成输出的整体理解和排版。Diffusion:这个大家可能都很熟悉了,SD这个名字中就包含它。
2024-06-21 08:18:35
1580
原创 ComfyUI 高级实战:极速稳定视频风格转绘
有的同学可能还不知道 ComfyUI 是什么,我这里做一个简单的介绍。ComfyUI 是一个基于扩散模型的AI绘画创作工具,扩散模型就是大家常说的 Stable Diffusioin,简称SD。使用SD进行AI绘画的常用工具还有 Stable Diffusion WebUI,有时也简称 SD WebUI,SD WebUI入门比较简单,适合新手,但是可定制性稍微差点,使用API进行操作也有一定的难度。
2024-05-27 13:44:25
6043
1
原创 StackExchange.Redis跑起来,为什么这么溜?
通过对同步API、异步API的执行逻辑分析,我这里总结了一张图,可以让大家快速的理清其中的处理逻辑。我再用文字描述下这个执行逻辑:1、无论是同步调用还是异步调用,StackExchange.Redis 底层都是先会创建一个 Message 对象;每个 Message 对象都会关联一个ResultBox对象(同步和异步调用对应的ResultBox对象略有不同),这个对象用来承载Redis执行结果;
2024-05-27 13:40:42
1032
原创 ComfyUI完全入门:图生图局部重绘
这篇文章的主题和美女有关,不过并不是教大家生产美女视频,而是讲解 ComfyUI 的图生图局部重绘,其中将会以美女图片为例,通过更改大长腿上的黑丝、白丝,来展示局部重绘的强大威力。
2024-05-25 22:39:46
2685
原创 ComfyUI 完全入门:图生视频
SVD是由 Stable Diffusion 的创作者 Stability AI 公司开源发布的。SVD的全称是 Stable Video Diffusion,也就是稳定视频扩散的意思,目前最新版本是1.1。这个模型以静止图像作为条件帧,并从中生成视频,目前还不支持使用提示词引导。默认参数下生成的结果是分辨率为1024x576的25帧视频,不过ComfyUI中实测也可以生成多种分辨率和更长时长的视频。SVD既可用于非商业用途,也可用于商业用途。
2024-05-20 08:00:15
8631
原创 图生视频,Stable Diffusion WebUI Forge内置SVD了!
之前SVD还不能集成到Stable Diffusion WebUI中,用起来比较不方便。现在Forge解决了这个问题,并且支持最新的1.1模型,这篇文章就来简单介绍下。
2024-05-13 12:29:01
3460
原创 ComfyUI 完全入门:必备插件
ComfyUI 是一个基于 Stable Diffusion 的AI绘画创作工具,最近发展势头特别迅猛,但是 ComfyUI 的上手门槛有点高,用户需要对 Stable Diffusion 以及各种数字技术的原理有一定的了解才行。这个系列将会介绍 ComfyUI 的一些基础概念和使用方法,让大家更快的掌握 ComfyUI 的使用技巧,创作出自己独特的艺术作品。本文继续分享 ComfyUI 的使用方法:必备插件。
2024-05-13 12:24:50
7662
1
原创 ComfyUI 完全入门:基本功能
大家好,我是每天分享AI应用的萤火君!在AI绘画领域,Stable Diffusion 因其开源特性而受到广泛的关注和支持,背后聚拢了一大批的应用开发者和艺术创作者,是AI绘画领域当之无愧的王者。目前使用 Stable Diffusion 进行创作的工具主要有两个:Stable Diffusion WebUI 和 ComfyUI。
2024-05-08 12:36:03
3828
原创 HTTPS对于网站到底价值几何?
现在HTTPS基本上已经是网站的标配了,很少会遇到单纯使用HTTP的网站。但是十年前这还是另一番景象,当时只有几家大型互联网公司的网站会使用HTTPS,大部分使用的都还是简单的HTTP,这一切是怎么发生的呢?
2024-05-08 12:34:14
930
原创 10倍加速,字节开源极快视频生成模型Animatediff-Lightning
Animatediff-Lightning 是一个跨模型扩散蒸馏模型,这里有两个关键词,特别介绍下;跨模型:指的是训练时使用多个不同的 Stable Diffusion 基础模型来进行训练,比如 DreamShaper、ToonYou等现实模型和动漫模型。使用这种方法训练出的模型可以搭配各种 Stable Diffusion 基础模型,都有比较好的视频生成效果,可以说拥有较强的泛化能力。
2024-05-06 08:08:31
1348
原创 ComfyUI 完全入门:安装部署
在AI绘画领域,Stable Diffusion 因其开源特性而受到广泛的关注和支持,背后聚拢了一大批的应用开发者和艺术创作者,是AI绘画领域当之无愧的王者。目前使用 Stable Diffusion 进行创作的工具主要有两个:Stable Diffusion WebUI 和 ComfyUI。Stable Diffusion WebUI 开箱即用,基本功能齐全,社区也有很多的插件支持,入门比较简单,适合新手,但是可定制性稍微差点,很多作品不容易传播复现,使用API进行操作也有一定的难度。
2024-05-06 08:00:19
5007
2
原创 4步生成高质量图像,Stable Diffusion WebUI 1.9.0来了!
上周Stable Diffusion WebUI正式发布了1.9.0版本,我也第一时间把AutoDL镜像升级到了最新版本,有几个比较重要的更新再和大家同步下。
2024-04-21 09:37:43
1764
原创 性能直逼GPT4,Llama3的三种在线体验方式
Llama3是一个大型语言模型系列,它们是一组预先训练好的、专为对话场景优化的文本生成模型,目前包含80亿参数和700亿参数两种规格,两个规格均有预训练版和经过指令调优的版本可供选择。Llama3模型仅接收文本输入,模型仅生成文本和代码。Llama3经过指令调优的模型在常见行业基准测试中,性能超越了许多现有的开源聊天模型。8B参数的性能甚至大幅超越了之前的Llama2-70B的性能,革了自己的命。Llama 3采用自回归语言模型设计,运用了优化后的Transformer架构。
2024-04-21 09:26:43
3838
原创 GET和POST请求到底有什么区别?
在计算机网络世界中,HTTP是开发者们会频繁接触的一个应用层通信协议,其中的Get和Post方法更是像吃饭、喝水一样不可或缺,不过很多同学却对它俩有些误解,或者说没有真正理解HTTP。比如GET请求没有POST请求安全,因为Get请求的参数都暴露在URL上了,任何人都能看见;而POST请求的数据被封装了起来,看起来更安全。还有同学可能会认为GET只能用来获取数据,POST只能用来提交数据;但实际上这些都是误解。HTTP请求方法的设计初衷并不是围绕“安全性”来设计的,而是为了表达不同类型的动作和意图。
2024-04-19 12:24:38
1086
原创 十分钟学会大语言模型微调
有同学给我留言说想知道怎么训练自己的大语言模型,让它更贴合自己的业务场景。完整的大语言模型训练成本比较高昂,不是我们业余玩家能搞的,如果我们只是想在某个业务场景或者垂直的方面加强大模型的能力,可以进行微调训练。本文就来介绍一种大语言模型微调的方法,使用的工具是我最近在用的 Text Generation WebUI,它提供了一个训练LoRA的功能。
2024-04-19 12:22:09
1596
原创 阿里开源的32B大模型到底强在哪里?
阿里巴巴最近开源了一个320亿参数的大语言模型Qwen1.5-32B,网上都说很强很强,那么它到底强在哪里呢?
2024-04-15 13:11:01
3038
2
原创 一个令人惊艳的图片高清化重绘神器:SUPIR来了!
今天给大家分享一个将模糊图片还原为照片级高清图像的AI项目:SUPIR。这个项目以尖端的大规模人工智能革新图像恢复技术,通过文本驱动、智能修复,将AI技术与创新思维相结合,赋予每张图像全新的生命力。这个项目的修复能力本质上是一种重绘能力,很多搞设计的同学都说挺不错。
2024-04-15 12:48:11
2314
原创 4G显存玩转AI绘画!Stable Diffusion WebUI Forge来了!
Forge的能力和原版WebUI的能力差不多,界面也基本上是一样的。下边我将主要介绍下 Stable Diffusion WebUI Forge 带来的三个主要新能力。
2024-03-26 08:03:44
2389
2
原创 什么是正向代理和反向代理?
从字面意思上看,代理就是代替处理的意思,一个对象有能力代替另一个对象处理某一件事。代理,这个词在我们的日常生活中也不陌生,比如在购物、旅游等场景中,我们经常会委托别人代替我们完成某些任务。在技术领域,这个概念也被广泛应用,尤其是在计算机网络通信和程序设计中,代理扮演着相当重要的角色,涉及控制访问、安全保护、能力扩展等复杂而强大的方面。
2024-03-26 07:57:27
685
原创 百万播放,手把手教你制作AI视频《印度女孩的一生》
本文给大家分享一个最近比较火的AI视频制作方法,这类视频大家可能都看过,就是《女孩的一生》或者《男孩的一生》,这类视频之所以这么火,首先是触动了大家的内心、产生了共鸣,让大家快速感受到了人生的漫漫旅途,其次就是AI制作的新奇方式,让人不免眼前一亮。于是这几天我自己也制作了一个类似的视频,并发布到了我的微信视频号上,结果当天就产生了5000多的播放量,后来继续发布又达到了1.4万的播放量,看来这个成功很可能是可以复制的,怀着略微激动的心情,特别分享给大家。万事俱备,现在就可以开始制作动画视频了。
2024-03-14 10:47:43
1177
原创 Stable Diffusion WebUI 1.8.0来了
上周 Stable Diffusion WebUI 发布了 1.8.0 版本,更新内容比较多,据说显存使用有了大幅的下降,这几天我也找时间把 AutoDL 镜像的版本做了个升级,有兴趣的同学可以去体验下新版本了。这里分享下其中几个我认为比较重要的更新。
2024-03-14 10:36:25
1713
原创 TCP和UDP可以使用同一个端口号吗?
TCP和UDP可以使用同一个端口号吗?首先说答案:可以。怎么理解呢?我想这个问题要从计算机网络通信谈起,学过计算机网络的同学,可能都还记得7层或者4层网络模型,TCP/UDP属于其中的传输层协议,在传输层之下是网络层,网络层主要通过IP协议来进行通信,这也是我们日常程序开发中能够接触到的最底层了,再往下的数据链路层和物理层就不是我们这些普通程序员需要关心的了。
2024-03-05 12:32:34
1601
原创 Latte:一个类似Sora的开源视频生成项目
Latte(Latent Diffusion Transformer)是一种用于视频生成的创新模型。它首先通过预训练的变分自编码器(VAE)将输入视频编码为潜在空间中的特征,并从中提取出时空令牌(Token)。然后应用一系列 Transformer 块对这些令牌进行建模,以捕捉视频数据分布。
2024-03-05 12:25:53
2038
2
原创 Java中各种O(PO,BO,DTO,VO等) 是不是人为增加系统复杂度?
Java中各种O(PO,BO,DTO,VO等) 是不是人为增加系统复杂度?在Java和其他编程语言的开发过程中,经常会用到几个以"O"结尾的缩写,比如PO,BO,DTO,VO等等,O在这里是Object的缩写,不同的O代表了不同的数据类型,很多时候这些O中的属性看起来都是差不多的,干的事情好像也只是一个简单的封装,那么搞出这么多O出来是不是人为增加了系统的复杂度呢?
2024-02-23 16:23:37
1266
dropList v1.1 - JavaScript无限级联动下拉列表框
2010-03-02
dropList v1.0-JavaScript无限级联动下拉框类
2008-06-18
asp本地excel数据导入服务器access[beta 1.0]
2007-07-26
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人