ComfyUI

Flux | 使用提示词和LoRA控制布局和背景清晰度

ByVito 2024年9月24日2025年1月21日

大家好！今天，我很高兴与大家分享一些我在使用Flux模型时学到的重要技巧。在过去的几天里，我生成了大约500张图片，通过调整提示词和LoRA，探索了如何通过不同的提示结构来控制图像的布局和背景清晰度。

在这篇文章中，我将详细介绍这些技巧，并展示如何在您自己的图像生成项目中使用它们。

让我们开始吧！

你还可以查看本篇文章的精彩视频教程：

Table of Contents

1. 使用提示词结构控制布局

控制图像布局最有效的方法之一是通过调整您在提示词中描述场景的方式。具体来说，您提供的细节程度以及描述的顺序对主体在画面中的大小和背景的清晰度有重大影响。

示例 1：主体优先

请看以下提示词：

A fisherman wearing a worn cap and a thick sweater, net slung over his shoulder, face weathered by the sea; a lively harbor at dawn.
一个戴着破旧帽子、穿着厚毛衣的渔夫，肩上挂着渔网，脸上布满海风的痕迹；黎明时分的热闹港口。

在这个例子中，大部分细节都集中在渔夫身上，而对港口的描述很简略。因此，生成的图像会主要聚焦于渔夫，渔夫在画面中占主导地位，而背景（港口）则模糊且不太详细。

示例 2：背景优先

现在，让我们将重点转移到背景上。将提示词修改为：

A lively harbor at dawn, with fishing boats rocking in the water, seagulls circling overhead; a fisherman in the distance, wearing a worn cap and sweater, net slung over his shoulder.
黎明时分的热闹港口，渔船在水中摇曳，海鸥在空中盘旋；远处有一个渔夫，戴着破旧的帽子和毛衣，肩上挂着渔网。

在这里，港口的详细描述占据了主导地位。生成的图像会更加突出港口，背景会更加清晰，而渔夫则出现在远处，画面中他显得较小。通过简单地改变描述的顺序和重点，我们就能得到完全不同的结果。

关键要点

通过改变提示词中各元素的描述顺序和细节层次，可以控制图像的焦点部分以及背景的清晰程度。

2. 内容如何影响背景清晰度

图像中背景的清晰度不仅受提示词中细节程度的影响，还与背景内容本身有关。从我在Flux模型上的实验来看，它几乎像一个智能摄影师，根据提示词中的描述自动调整模糊程度。

让我们通过一些例子来展示提示词的措辞如何影响背景的焦点和清晰度。

示例 1：高度详细的背景，模糊的主体

看看以下提示词：

A snowy alpine village nestled among towering peaks with snow-capped mountains, smoke rising from cozy chalets, skiers carving paths down pristine slopes; evergreen trees dusted with fresh snow, the crisp air filled with laughter and the aroma of hot cocoa; a snowboarder adjusting his goggles, breath forming clouds in the cold air, eyes reflecting excitement.
一个被高耸山峰环绕的雪地山村，积雪覆盖的群山，温暖的木屋冒着烟，滑雪者在洁白的坡道上飞驰；常青树上覆盖着新雪，空气清新，充满笑声和热可可的香气；一个滑雪者正调整护目镜，寒冷的空气中他的呼吸凝成云雾，眼中充满了兴奋。

在这个提示词中，大部分描述都集中在景观上——阿尔卑斯山村、群山和常青树。由于对景观的描述如此详细，生成的图像使背景变得非常大且清晰。相比之下，滑雪者显得很小且遥远，虽然提到了他的动作，但由于他占据画面较少，细节并没有得到很好捕捉。

这表明，提示词中对背景的描述细节相对于主体的描述，直接影响了每个元素在画面中的清晰度和大小。背景描述越详细，它就会越清晰且突出。

示例 2：通过简单调整让主体成为焦点

现在，让我们通过在滑雪者前加上短语“特写镜头”来调整原始提示词：

A snowy alpine village nestled among towering peaks with snow-capped mountains, smoke rising from cozy chalets, skiers carving paths down pristine slopes; evergreen trees dusted with fresh snow, the crisp air filled with laughter and the aroma of hot cocoa; a closeup shot of a snowboarder adjusting their goggles, breath forming clouds in the cold air, eyes reflecting excitement.
一个被高耸山峰环绕的雪地山村，积雪覆盖的群山，温暖的木屋冒着烟，滑雪者在洁白的坡道上飞驰；常青树上覆盖着新雪，空气清新，充满笑声和热可可的香气；一个滑雪者的特写镜头，他正在调整护目镜，寒冷的空气中呼吸凝成云雾，眼中充满了兴奋。

通过这个小调整，图像发生了巨大变化。滑雪者现在变得更大，画面中占据更多空间。虽然背景依然清晰，但滑雪者成为了主要焦点，占据了前景。不过，尽管滑雪者更加突出，但他调整护目镜的动作仍未完全被捕捉到。这引出了一个重要问题：添加“特写”可以增加主体的大小，但并不一定使主体的每个动作细节都清晰可见，尤其是当背景仍然相对详细时。

示例 3：减少背景细节以突出动作

让我们再做一次修改，这次通过减少对背景的描述：

a snowy alpine village; a snowboarder adjusting their goggles, breath forming clouds in the cold air, eyes reflecting excitement
一个雪地山村；一个滑雪者正在调整护目镜，寒冷的空气中呼吸凝成云雾，眼中充满兴奋。

在这个提示词中，我们大幅削减了背景的细节，更多地集中在滑雪者的动作上。因此，生成的图像会更清晰地展示滑雪者，甚至捕捉到了他调整护目镜的具体动作。布局从远景的半身镜头变成了更近、更详细的全身镜头。

不过，这里有一个权衡：背景变得更加模糊，因为不再对其进行详细描述。提示词中对主体和背景的关注度直接影响了它们各自在画面中的清晰度和平衡。

示例 4：通过改变主体顺序获得不同布局

让我们进一步实验，将滑雪者放在提示词的开头：

a snowboarder adjusting their goggles, breath forming clouds in the cold air, eyes reflecting excitement; a snowy alpine village
一个滑雪者正在调整护目镜，寒冷的空气中呼吸凝成云雾，眼中充满兴奋；一个雪地山村。

在这个版本中，滑雪者的细节是图像的主要焦点。他在画面中占据了很大的空间，所有描述细节——从他的呼吸形成的云雾到眼中的兴奋——都被清晰地描绘出来。而背景几乎不可见，严重模糊，画面中占据很少部分。

结果对比

通过对比从这些不同提示词生成的图像，可以看出内容的顺序和描述的详细程度直接影响背景的清晰度和主体的大小。

在第一个例子中，滑雪者在远处且很小，背景非常清晰且详细。
在第二个例子中，滑雪者变大了，但他的动作仍难以看清。
在第三个例子中，我们清晰地看到滑雪者调整护目镜，但背景变得模糊。
在第四个例子中，滑雪者主导了画面，而背景几乎成了附带元素。

提示词的结构和描述顺序对主体大小和背景清晰度有重要影响。

这种差异可能很明显,让我们再看几幅图片。请注意,内容的顺序仍然对整体布局有很大影响。

一些能产生影响的关键词

在这些例子中，一个产生显著效果的关键词是“特写镜头closeup shot of”。这是一个非常有效的工具，可以让主体成为焦点，并显著改变图像的构图。同样，使用“in the distance远处”或“foreground前景”等短语，也可以调整主体和背景之间的焦点。这些短语允许您微调图像的视角和平衡。

关键要点

提示词的内容直接影响背景是清晰还是模糊。当您添加更多背景细节时，背景会变得更加清晰和突出。如果您希望主体主导画面，减少对背景的描述或将主体放在提示词的开头，可以将焦点转移到主体上。

3. 使用关键词调整布局

提示词中的某些关键词可以直接控制主体在画面中占据的空间大小以及背景的清晰度。这些关键词像指令一样，影响图像的焦点。

特写镜头

使主体成为焦点，增大并使其更加详细，而背景变得模糊。

远处

将主体推远，使背景变得更加突出和清晰。

鸟瞰图

将视角转为更高、更远的视点，捕捉更多背景，减少主体的突出性。

这些关键词为您提供了强大的控制能力，能够灵活地调整生成图像的布局，使您可以更轻松地实现所需的视觉效果。

4. 使用LoRA控制背景清晰度

在使用Flux模型生成图像时，常见的一个挑战是：当主体在画面中占据更多空间时，背景往往会变得过于模糊。这可能是个问题，尤其是当背景在设定场景或增强图像整体氛围中起着至关重要作用时。

例如，看看以下这些图片：

那么，如何在保持主体清晰的同时，确保背景也保持清晰、详细呢？

一种方法是在提示词中为背景添加更多细节。然而，每次都写出冗长复杂的提示词并不总是理想的，特别是在您想要保持主体与背景之间的平衡，而不希望提示词过于繁杂时。

引入LoRA：更高效的解决方案

一种更高效的方法是使用LoRA（低秩适应）来控制背景的清晰度，而不仅仅依赖于提示词。LoRA允许您微调模型的行为，特别是减少背景中的模糊程度，而不影响主体的大小或焦点。

LoRA的工作原理

LoRA实际上是一种轻量级的修改，能够将预训练模型适配到您的特定需求上，在这个案例中，它可以帮助减少背景模糊。当像Flux这样的模型生成的图像背景不够清晰时，LoRA尤其有用。

在ComfyUI中设置LoRA

为了简化流程，我已经在ComfyUI中为您设置了一个自定义工作流。下载链接：

工作流：

消除模糊Flux LoRA：

工作流概述

在工作流的左侧，您会看到一个标准的Flux模型设置，但增加了一个LoRA节点来管理背景模糊。下面是如何设置和有效使用LoRA的步骤：

加载LoRA节点：在预配置的ComfyUI工作流中，您会看到Flux模型作为基础模型。不过，我专门添加了一个用于减少背景模糊的LoRA节点。您可以根据需要调整LoRA的强度。为了演示，我将LoRA的强度设置为最大值2，但您可以根据自己的需求微调这个设置，以找到图像的最佳平衡点。
使用更高效的KSampler：与传统的KSampler（Stable Diffusion工作流中的标准采样方法）相比，我选择了一个更高效的KSampler。这有助于简化过程，并在使用LoRA时产生更干净的结果。

高分辨率修复工作流

工作流的右侧，我们处理高分辨率修复，进一步提高最终图像的清晰度和质量：

首先，我们使用Upscale Latent节点来提高图像的分辨率，增强其整体清晰度。
然后，我们应用图像到图像重绘，进一步优化图像，确保尤其是背景中的任何模糊现象得到最小化。

LoRA与无LoRA的对比

现在，让我们对比一组使用和不使用LoRA生成的图像：

第一张图片使用的是未应用LoRA的Flux模型。如您所见，虽然主体很清晰，占据了画面的很大一部分，但背景非常模糊。
第二张图片应用了LoRA。这里，背景变得更加清晰，即使主体依然占据画面的大部分空间。LoRA能够在不影响主体清晰度的情况下，让背景更加详细。

通过将LoRA与高分辨率修复结合使用，最终的结果是背景更加清晰、更具细节。这为解决使用Flux或类似模型时背景模糊的问题提供了一个实用而高效的解决方案。

自定义LoRA强度

使用LoRA的另一个优势是，您可以根据需要自定义其强度。如果您觉得背景仍然过于模糊或过于清晰，可以通过调整LoRA节点的强度来获得更精细的控制。这种灵活性允许您生成在主体聚焦和背景细节之间达到理想平衡的图像。

在您的下一个图像生成项目中试试使用LoRA，看看它能带来怎样的不同效果！

结论

总结一下，这里是控制Flux图像布局和清晰度的关键技巧：

通过调整提示词中的细节层次，可以控制主体的大小和背景的清晰度。
通过改变描述顺序，可以在主体和背景之间切换焦点。
使用关键词，如“特写镜头”或“远处”，可以微调图像的布局和视角。
如果在聚焦主体时背景变得过于模糊，可以使用LoRA来在不牺牲主体大小的情况下使背景变得更加清晰。

掌握这些技巧，您将能够更好地控制图像的构图，轻松创造出您想要的视觉风格。希望这些技巧对您有所帮助！

ComfyUI

EcomID vs. Flux PuLID vs. InstantID -> 100%相似度人脸迁移工作流 V2

ByVito 2024年11月8日2025年1月21日

大家好，今天我们将对比三种AI换脸技术：基于Flux的PuLID、基于SDXL的InstantID以及最近推出的基于SDXL的EcomID。你可以在这里免费下载这个工作流：https://www.liblib.art/modelinfo/67e6949d10f844c3bc35c15add791aa1 这三种技术各有优势，但都还无法达到100%的人脸相似度。为了追求更真实的效果，我之前开发了一个能够达到接近100%相似度的工作流，并进行了多次优化和增强，特别加入了高清修复的部分。接下来，我将详细讲解每个节点组的功能，帮助大家了解实现高相似度人脸的原理。本视频对应的视频教程：工作流概览首先，我们来看一下这次用来对比三种换脸技术的工作流。大家可以在本文末尾找到下载链接。基础设置工作流左边是一些基础设置区域，主要用于：这些设置通过“Bus Node（节点总线）”和“Anything Everywhere（全局输入）”节点传递到右侧的各个换脸节点组，从而实现参数的集中管理。这种方式可以减少节点之间的连接线，使工作流更加简洁高效。例如，EcomID和Flux PuLID都需要用到PuLID的Eva Clip模块，这里就通过“Anything Everywhere”节点统一传递，免去了重复连接的麻烦。同时，加载InstantID的节点也通过“Anything Everywhere”传递到右侧供EcomID和InstantID共享。此外，“Seed Everywhere（全局种子）”节点确保了所有换脸节点组使用相同的种子，以保证对比结果的公平性。三种换脸技术的节点组在右侧，我们可以看到三个换脸节点组：每个节点组生成的图片会被拼接在一起，与原始人脸参考图进行对比。我通过“Image Caption（图像字幕）”节点为每张生成图像添加了字幕，注意需要填写ttf格式字体的路径，否则会报错。效果对比在对比了多个示例后，我认为InstantID在大部分情况下的相似度最高。不过，具体效果因人而异，有时PuLID或EcomID的效果也很接近原图。总体而言，换脸技术的优势在于：但缺点是生成的人脸和真实人脸的相似度仍有不足。为此，我开发了一个号称能够实现100%相似度的工作流。经过用户反馈和优化调整，我们现在来深入讲解这个工作流的细节。完美人脸匹配的逐步工作流解析现在，我们来详细解读我开发的优化工作流的各个部分，以提高人脸相似度并解决常见问题，如脖颈处的接缝和其他不必要的瑕疵。 1. 初始设置与遮罩 2. 使用 SDXL 进行基础构图 3. 处理常见瑕疵并增强细节使用 Flux 修复接缝和瑕疵额外重绘以进行进一步修复 4. 最终处理与放大手部细节优化高清放大以获得高分辨率效果 5. 对比结果最后，将生成的结果与原始参考图像进行对比。此工作流应该能够生成与原始人脸高度匹配的图像，具备清晰的细节和精致的纹理。如果需要进一步微调，可以考虑在 Photoshop（PS）中进行最后的修饰。 ⚡️发电获取此独家工作流： https://afdian.com/p/e9322ec49d5d11efa28c52540025c377 总结与建议通过这个高相似度换脸工作流，我们可以实现非常逼真的AI人脸替换效果。脸部、手部以及其他细节都可以达到理想的精细度。如果细节还不够完美，还可以在PS中进行进一步微调和融合。欢迎大家提出反馈和建议，我会根据大家的需求持续优化迭代这个工作流。感谢大家的关注，期待下次再见！

ComfyUI

基于RF Inversion的风格和人脸迁移，8步逆采样出图，比Flux IP-Adapter强多了

ByVito 2024年11月8日2025年1月21日

在这期视频中，Vito向大家介绍了利用RF Inversion技术开发的ComfyUI工作流，分享了其诸多强大功能及相关使用要点： ### 一、工作流亮点与获取方式 – **功能超酷**：该工作流结合阿里妈妈的Turbo LoRA，用Flux生成图片超快，仅8步即可出图，能实现多种令人惊叹的效果。 – **免费下载**：工作流链接放在视频下方描述里，可免费获取。 ### 二、多样的图片处理效果 – **风格迁移**： – 可实现“Semantic Style Transfer”，如将参考图的传统风格迁移到生成图上，人物姿势也能相似，且无需IP-Adatper和ControlNet控制，靠“RF反转”及提示词就能达成。 – 除写实风格外，还能迁移漫画、插画、绘画等风格，通过调整工作流参数可改变风格迁移方向，如用不同参数跑70张图，能呈现从写实到插画风格的过渡及构图迁移。 – **光影效果**：只需一张参考图，就能让处理后的光线更自然，还能保持人脸相似度，使皮肤更细腻、头发更顺，同时可实现光线、色彩、构图的同时迁移，甚至能实现摄影里的柔焦功能，还可将低质量图片转化为高质量图片。 ### 三、工作流相关设置与节点介绍 – **节点分组及功能**： – 工作流共分4个节点组。左边组用于基础设置，如上传参考图、设置尺寸、填写提示词等。 – 右上角节点组对参考图进行逆采样得到潜空间里的噪波图像。 – 下面的节点组是PuLID，可决定生成图片里人物的样子，不想生成人像可绕过。 – 最下面节点组对噪波图像重新采样生成最终图片。 – **关键节点操作**： – **上传参考图**：这步很关键，要选接近想要效果的图片，可对参考图进行水平翻转等操作，若参考图有不理想细节，可通过提示词或局部重绘改动。 – **逆采样节点组**：此节点组进行“RF反转”得到噪波图像，因用了“turbo alpha LoRA”加速，“Steps步数”一般填8步，追求极致效果可改更高步数，且要和最后节点组里的“基础调度器”设置一致。 – **Flux PuLID节点组**：不熟悉可看相关视频。 – **最下面节点组**：重点是“Flux反向ODE采样器”节点里的“eta”“结束步数”等参数，“eta”类似权重调整ODE采样控制力，“开始步数”一般设为0，“结束步数”范围设2 – 8，“eta trend”调整eta施加影响的方式，通过实际案例展示了不同参数值对图像的影响，还介绍了“linear increase”“constant”等“eta trend”选项生成的不同结果。 ### 四、提示词设置要点 – “逆采样提示词”引导“逆采样”过程，可先不填看效果；“采样提示词”引导最终生成图片过程，更为重要，通过调整“eta”值及添加提示词的示例，展示了提示词设置对生成图片效果的影响，若不确定“逆采样”提示词写法，可后期完善。…

ComfyUI

用区域裁剪实现更好的Flux局部重绘【ComfyUI工作流】

ByVito 2024年12月19日2025年1月21日

Hello 大家好，我是Vito。在本文中，我们将深入探讨一个先进的 ComfyUI 局部重绘工作流，旨在实现更大的灵活性和高效性。在我之前的文章中，我介绍了使用不同版本的 Fill 模型进行扩图和局部重绘的结果对比，以及一个实用的扩图工作流。今天，我们将重点关注局部重绘，特别是如何更换物品、修正扭曲的面部，甚至修复那些棘手的 AI 生成的手部。对于喜欢通过视频内容深入了解 ComfyUI 的朋友们，欢迎去B站查看配合本文的精彩视频教程：让我们开始吧！高度的通用性我开发的这个工作流具有高度的通用性，并且与量化模型配合使用效果良好，使其在显存使用上更加高效。无论你是修改细节，比如更换帽子或修复手部，这种方法都能帮助你以最小的麻烦实现高质量的结果。让我来详细展示如何使用这个设置。 1. 基础设置步骤1：加载模型首先，绕过其他节点组，激活第一个节点组，该组负责加载模型。我已经为你预先配置好了这一部分，所以我们可以直接运行工作流。组中的第一个节点加载 Fill 模型，这个模型既适用于扩图任务，也适用于局部重绘任务。在本次演示中，我使用的是量化的 Q5 版本模型 [1]。它只占用 8 GB 的显存，管理起来更加轻松。如果你的显存不足，可以选择 Q4 版本，只需 6.8 GB。经过我在之前的文章中验证，Q5 和黑森林实验室的 20 GB 模型在结果上的差异实际上非常小。你可以放心地使用这些较小的版本进行第一轮局部重绘。为了速度和效率，我在右侧的节点中添加了一个 Turbo LoRA [2]，以加快图像生成速度。 Fill 模型下方的节点 [3] 加载一个checkpoint。它决定了图像的最终质量。如果需要，你可以加载一个量化的checkpoint，如 FluxRealistic，它只需要 6.8 GB 的显存，但仍然能提供良好的质量。这里还有另一个 Turbo LoRA 节点 [4]，但我将其强度设置为零，因为在这个阶段它不是很有用。你可以在稍后的任务中，比如修复面部或手部时再回来使用它。步骤2：限制图像大小…

ComfyUI

在ComfyUI中使用XYZ图表测试LoRA

ByVito 2024年4月23日2025年1月21日

在之前一篇训练人脸LoRA的文章中，我介绍了如何在WebUI中使用XYZ图表来测试训练好的一批LoRA。虽然WebUI中的XYZ图表十分实用，但其运行速度相比ComfyUI要慢许多。测试LoRA时，我发现经常需要花费超过半小时来处理大量图像。因此，本文将详细介绍如何在ComfyUI中使用XYZ图表进行LoRA测试的过程。这个工作流程非常简单，只需要四个节点。让我们开始吧。如果你喜欢看视频教程，那么我非常欢迎你观看本文所对应的视频(B站同名帐号)：步骤一：设置效率加载器和采样器首先，打开ComfyUI界面。使用鼠标左键双击以弹出搜索节点的工具栏。在搜索框中输入“efficient”，查找并选择“Efficient Loader”节点。如果你不熟悉这个节点或其功能，可以参考我之前的文章，了解如何在ComfyUI中使用LoRA。接下来，我们还需要一个采样器来进行图像生成。再次打开搜索栏，输入“efficient”，找到并选择带有“Efficient”标签的采样器节点。这种采样器是专为与效率加载器配合使用设计的。将这两个节点连接起来后，我们的基础设置就完成了。步骤二：选择模型并运行测试图像现在，选择一个适合的模型并输入必要的提示词。然后，运行模型生成一张测试图像。确保图片显示正确无误。步骤三：接入并配置XYZ图表将效率加载器和采样器的节点稍微分开，为后续的其他节点留出空间。接下来，在采样器节点找到“script”脚本输入端口。点击并拖动此端口，选择出现的“XY Plot”（XY图表）选项。将此图表的“dependencies”输入端连接至效率加载器的相应输出端。然后，设置XY图表的轴。对于X轴，点击并拖动其输入端，选择“搜索”，在搜索框中输入“lora”，选择显示的LoRA图表。设置测试LoRA的数量（例如10个版本），以及LoRA的路径（我用的是服务器，请根据你的情况适当调整路径格式）。设置Y轴测试的权重数量，例如从0.6到1的权重范围，填入5。此外，填入Y轴的起始值0.6和终止值1。最后，别忘了把Y轴的输出端也连接一下。步骤四：生成并保存XYZ图表完成所有设置后，运行图表并检查结果。通过右击采样器节点并选择“打开图像”，查看X轴显示的10个LoRA及其名称，Y轴显示的是从0.6到1的权重范围。如果需要保存图像，可以通过右键点击图像并选择“另存为”。另外，回到ComfyUI设置，确保将“采样器输入图像”参数配置到图表中。接着在采样器节点的图像输出端拖出一个“保存图像”的节点，再运行一次。这样，XY图表就可以保存到ComfyUI的输出目录，方便后续查看和使用。以上就是如何在ComfyUI中使用XYZ图表来测试LoRA的完整流程。希望这篇教程对你有所帮助！另外，给大家推荐我正在跑SD的云平台：https://myaiforce.com.cn/lanrui/

ComfyUI

AI换脸技术大比拼：PuLID vs InstantID vs FaceID

ByVito 2024年5月23日2025年1月21日

今天，我们将通过一个ComfyUI工作流来对比三种AI换脸技术，分别是PuLID、InstantID和IP-Adapter的FaceID-V2版本。这些技术的核心原理相似，都是基于一个名为InsightFace的人脸分析技术，该技术需要授权才能商用。InsightFace是一个深度人脸分析库，用于人脸识别、人脸检测和人脸对齐。 IP-Adapter FaceID是这三种技术中最早推出的。接下来推出的是InstantID。PuLID是最近推出的换脸技术。这三种方案都需要你提供一张人脸参考图。因此，换脸的效果在很大程度上取决于你提供的那张参考图的质量和适配度。接下来我们来通过一个ComfyUI工作流同时对比这三种换脸方式的效果。工作流的下载地址是：https://pan.baidu.com/s/19K60iNk1LGlNZJBCu7HuJA?pwd=lzo4 。我会先演示下如何使用这个工作流，然后用这个工作流生成4组图片，并进行打分，来评估它们的效果。如果你喜欢看视频教程，那么我非常欢迎你观看本文所对应的视频(B站同名帐号)：工作流配置和说明当你下载好相关节点并导入ComfyUI以后，可能会发现缺少一些节点。这时候只需要在ComfyUI管理器中安装这些节点并重启ComfyUI即可。建议在安装节点之前先升级ComfyUI，否则即使安装了节点，也可能仍然提示缺失节点。除了节点之外，还需要安装一些必要的模型。模型的下载地址和存放路径，可以在节点的GitHub主页上找到详细介绍。以最近的PuLID为例，安装说明中提到需要下载PuLID的预训练模型，然后将其放到ComfyUI/models/pulid/文件夹中。另外，第一次运行PuLID时，会自动下载一些模型。导入工作流以后，让我们从下往上看看它的结构。 1️⃣ 共享节点：最下面是PuLID、InstantID和FaceID共用的节点。它们使用的Checkpoint、提示词、潜空间图片的尺寸和固定的种子值是相同的，这样可以更有利于同时对比它们的效果。 2️⃣ 模型节点组：再往上，有三个节点组。从左到右依次是PuLID、InstantID和IP-Adapter-FaceID。工作流的作者将它们安排得井井有条，非常直观。 3️⃣ 参考图像节点：再往上，右击名称为”Face”的节点，通过右键菜单最上面的选项，可以发现它实际是一个”加载图像”的节点。这个节点加载的是一张有人脸的照片，用来给PuLID、InstantID和FaceID作为参考。运行工作流并对比效果了解了工作流的运行逻辑后，我们可以开始运行工作流，对比这三种换脸方式的效果。运行步骤 1️⃣ 确保所有必要的节点和模型都已安装和配置正确。 2️⃣ 导入工作流，并检查各节点的连接和配置。 3️⃣ 加载参考图像，并确认图像路径和格式正确。 4️⃣ 运行工作流，生成三种换脸技术的效果图。 5️⃣ 对比生成的效果图，分析PuLID、InstantID和IP-Adapter FaceID的差异和优劣。对比效果用这个工作流生成4组图片，并进行打分，来评估它们的效果。我设定了4个评分维度，为了方便起见，每个维度的分值都设定为1-3分：第一组图片： PuLID InstantID FaceID 提示词契合度 2 3 1 脸部光效 1 3 2 人脸相似度 1 2 3 脸部细节度 1…

ComfyUI

超简单 Flux 换背景工作流：结合最新 ControlNet 深度 Depth 模型

ByVito 2024年10月3日2025年1月21日

在本篇文章中，我们将深入探讨如何使用 Flux ControlNet Depth 模型进行换背景。这种方法是我之前基于 Flux 模型换背景工作流的简化版。虽然旧的工作流程功能强大，但它非常复杂且运行缓慢。今天，我们将学习一个更快速、更易用的替代方案。欢迎去B站观看本文对应的视频教程： Flux ControlNet Depth 模型的新特性这款由 Jasper AI 开发的全新 ControlNet 模型的最大优势是，它可以与现有的 SDXL ControlNet 节点和采样器兼容，无需专门的Flux ControlNet 节点。这大大简化了搭建过程，使其更容易集成到您的现有工作流中。关键优势：模型下载在开始之前，请从 HuggingFace下载 Flux ControlNet Depth 模型。下载后，请按照以下步骤操作：如果您在流程中看到某些节点缺失，只需安装它们即可确保所有功能正常运行。工作流程概览该新工作流程分为三个主要部分：整个流程大约包含 30 个节点，运行速度比以往更快。例如，在一张 3090 GPU 上，它可以在大约 1 分钟内生成一张图像。使用 Hyper LoRA 的 8 步图像生成甚至可以进一步提高速度！让我们先看看原始图像和使用此工作流更换了背景的图像：工作流程下载您可以在这里下载完整的工作流。在使用它之前，请确保已正确下载并配置 ControlNet Depth 模型。接下来，让我们逐步讲解每个部分的详细操作。第…

1. 使用提示词结构控制布局

示例 1：主体优先

示例 2：背景优先

关键要点

2. 内容如何影响背景清晰度

示例 1：高度详细的背景，模糊的主体

示例 2：通过简单调整让主体成为焦点

示例 3：减少背景细节以突出动作

示例 4：通过改变主体顺序获得不同布局

结果对比

一些能产生影响的关键词

关键要点

3. 使用关键词调整布局

特写镜头

远处

鸟瞰图

4. 使用LoRA控制背景清晰度

引入LoRA：更高效的解决方案

LoRA的工作原理

在ComfyUI中设置LoRA

工作流概述

高分辨率修复工作流

LoRA与无LoRA的对比

自定义LoRA强度

结论

Similar Posts

Leave a Reply Cancel reply