Flux官方最新王炸模型，7合1工作流 (ControlNet+局部重绘+扩图+风格迁移)

ByVito 2024年11月23日2025年1月21日

黑森林实验室（Black Forest Lab），作为革命性 Flux 模型的创造者，最近推出了一套强大的新工具，旨在重新定义我们在 ComfyUI 中处理图像生成和编辑的方式。这些尖端模型——Fill, Canny, Depth 和 Redux——带来了诸如局部重绘（inpainting）和扩图（outpainting）、精确边缘检测 (Canny)、深度映射 (Depth) (Depth)以及创意风格迁移等高级功能。

然而，真正让 Flux 工具脱颖而出的是它的性能。在一对一的基准测试中，Flux 模型始终优于类似的专有解决方案，如 Midjourney ReTexture 和 Ideogram V2。例如，Flux.1 Fill [pro] 模型目前被认为是最先进的局部重绘模型，在质量和效率上都无出其右。同时，Flux.1 Depth [pro] 模型在深度感知任务的多样性和可靠性上超越了 Midjourney ReTexture。

本文将深入解析这些模型的独特功能，并为您提供一个高效的工作流，帮助您快速上手。

Table of Contents

功能与工具概述

全新 Flux 模型套件——Fill, Canny, Depth 和 Redux 提供了顶级的性能和多功能性。以下是每个模型的功能以及它们如何超越竞争对手的简要介绍。

1. Fill 模型：局部重绘与扩图的强大引擎

Fill 模型为局部重绘与扩图设立了新的标杆，呈现出卓越的细节和无缝的过渡效果。

主要特点：
- 将局部重绘和扩图任务集成到一个模型中。
- 在编辑区域与原始图像之间提供完美的过渡，使修改难以察觉。
- 即使在复杂的编辑或图像扩图中，也能保持高效可靠。
相比竞争对手的优势：
- 提供更高的准确性和一致性，优于如 Ideogram V2 等专有工具。
- 比传统解决方案更高效，是追求高质量结果而不牺牲速度的理想选择。

2. 结构化控制：Canny 和 Depth

结构化控制（Structural Conditioning）在图像变换工作流中是一项强大的功能，它通过 Canny 边缘检测或 深度映射 (Depth) (Depth) 来保持原始图像的结构完整性。此过程允许用户在保持构图和关键细节（如轮廓、形状和空间深度）的同时进行精确的文本指导编辑。

主要应用：
- 适用于需要保留原始结构的重绘纹理或风格迁移任务。
- 使纹理、材质或细节更改变得无缝，同时保持对象的形状完整。
Flux 的结构化控制优势：
- Canny 边缘(Canny)图：专注于边缘精度，确保轮廓的清晰度和准确性，以实现高度可控的编辑。
- 深度映射 (Depth)：通过保留光影和空间关系，增强变换的维度感，确保变换的真实性。

Flux 如何超越竞争对手：

Canny 边缘检测：
- Flux.1 Canny [pro] 模型提供了市场上最精确、高质量的边缘检测，非常适合需要精确结构控制的工作流。
- Dev 版本提供了一个可靠且高效的替代方案，输出一致性依然优秀。
深度映射 (Depth)：
- Flux.1 Depth [pro] 模型在输出的多样性上表现优异，非常适合创意任务，如重绘纹理或生成新构图。
- Dev 版本优先考虑一致性，是需要精确深度感知任务的可靠选择。
- 与 Midjourney ReTexture 等专有工具相比，Flux.1 Depth 提供了更细腻的结果，尤其是在保留光影和空间细节方面。

3. Redux 模型：革新风格迁移

Redux 模型为 Flux 带来了高级的风格迁移功能，类似于 SDXL 中的 IP-Adapter，但有显著改进。

主要特点：
- 应用艺术风格，同时保留参考图像的结构完整性。
- 与微调模型兼容，支持更具创意的定制。
相比竞争对手的优势：
- 将效率与质量相结合，在不牺牲性能的情况下提供创作灵活性。
- 与其他 Flux 模型无缝协作，提高了其在多样化工作流中的可用性。

工作流设置

为了充分发挥 Flux.1 Dev 模型的潜力，我开发了一套集成工作流，用于在 ComfyUI 中高效使用这些模型。此工作流结合了所有六种模型——Flux.1-Canny-Dev、Flux.1-Canny-Dev-LoRA、Flux.1-Depth-Dev、Flux.1-Depth-Dev-LoRA、FLUX.1-Fill-Dev 和 FLUX.1-Redux-Dev，从而实现了多种任务的高效处理。

为什么只使用 Dev 版本？
Pro 版本仅通过 Black Forest Lab 的 API 提供，具备更高的多样性和增强的精度。
Dev 版本则针对 ComfyUI 的本地工作流进行了优化，设计轻量化且对显存更友好，同时仍能提供卓越的结果。

工作流结构

工作流以模块化结构组织，用户可根据需要混合搭配模型组。以下是工作流布局的细分：

基本设置与图像预处理
结构化控制节点组
- Canny 组
- Depth 组
Fill 模型节点组
- 局部重绘组
- 扩图组
Redux 模型节点组

模型安装

flux1-canny-dev: https://www.liblib.art/modelinfo/b9e8a2d4d29349a3af839e52f388de06
flux1-canny-dev-lora: https://pan.baidu.com/s/1eYY9T-gNlwy8_HU4BBdWHQ?pwd=az48
flux1-depth-dev: https://www.liblib.art/modelinfo/b9e8a2d4d29349a3af839e52f388de06
flux1-depth-dev-lora: https://pan.baidu.com/s/1ganA5MfzKbbhP41TN9ZCiA?pwd=p61x
flux1-fill-dev: https://www.liblib.art/modelinfo/144a9ec744bb47c8b77004e0c8e5a276
flux1-redux-dev: https://www.liblib.art/modelinfo/af40d05f477f4062ab8fbf6977c7f55e
更多 Flux 微调模型请参阅：https://myaiforce.com.cn/flux-fine-tuned-checkpoints-comparison/
⚡️发电解锁工作流完整截屏+详细安装指导：https://afdian.com/p/52b666c0a8d611efb03b5254001e7c00
视频教程：

节点组 1：基本设置

基本设置节点组是整个工作流的基础。它在将输入传递给其他模型组之前，确保所有必要的配置到位。此组负责标准化图像预处理，并为后续阶段准备关键数据，例如边缘(Canny)图和深度(Depth)图。以下是详细的分步解析：

1. 基本设置组的核心组件

此组负责处理以下任务：

全局设置（例如 Clip 和 VAE 模型的加载）。
图像预处理以确保模型组之间的一致性。
通过边缘检测（Canny）和深度映射 (Depth)生成初始结构化数据。

2. Clip 和 VAE 设置

在此组的核心是 “Anything Everywhere 3” 节点，它负责管理 Clip 和 VAE 模型的分发。这些模型对于在所有节点组中生成一致且高质量的输出至关重要：

Clip 模型：
- 负责理解和处理文本提示词。
- 可选择两种 t5xxl Clip 模型：
  - fp8 版本：针对更低显存使用量和磁盘空间进行了优化。
  - fp16 版本：提供更高的精度，但需要稍多的 VRAM。
VAE 模型：
- 负责将图像数据编码和解码为潜在空间。
- 确保工作流中的所有模型接收兼容的数据格式。

3. 图像预处理

适当的图像预处理对于在整个工作流中保持一致的结果至关重要。此步骤包括：

图像调整大小节点：
- 确保输入图像的比例适当，以避免 GPU 负载过重。
- 有助于标准化模型组的图像维度。

4. Canny 边缘处理

Canny 边缘处理生成精确的边缘(Canny)图，供 Flux.1-Canny-Dev 模型在工作流的后续阶段使用：

步骤：
1. 将预处理后的图像输入到 Canny Edge 节点。
2. 调整最小和最大阈值参数以控制边缘敏感度。
3. 将生成的边缘(Canny)图输出到结构化控制工作流中的相应节点。
目的：
- 创建清晰的图像结构轮廓，在变换中保持形状和轮廓的完整性。
- 尤其适用于诸如重绘纹理等任务，需要严格保留原始形状。

5. 深度(Depth)图处理

深度(Depth)图处理生成深度数据，这是 Flux.1-Depth-Dev 模型进行空间感知图像变换的关键：

步骤：
1. 输入预处理后的图像。
2. 将深度(Depth)图传递给深度模型的节点组进行进一步处理。
目的：
- 提供图像的三维视角，捕捉光影和空间关系。
- 支持现实主义的变换，例如材质更改或深度感知的重绘纹理。

节点组 2：Canny 边缘检测

Canny 节点组是工作流的第一个结构化控制组件。它使用 Flux.1-Canny-Dev 模型生成边缘(Canny)图，并将精确的结构约束应用于图像，以确保原始构图和形状保持不变。此功能尤其适合需要保留原始图像形式的重绘纹理任务。

节点设置和工作流程

以下是 Canny 节点组的结构：

加载扩散模型节点：
- 加载 Flux.1-Canny-Dev 模型到工作流中。
- 模型文件必须存储在 models 文件夹下的 diffusion_models 目录中。
边缘(Canny)图输入：
- 基本设置组生成的边缘(Canny)图被作为输入传递到此组。
InstructPixToPixConditioning 节点：
- 此节点将边缘(Canny)图与文本提示词整合，条件化图像变换。
- 关键参数：
  - 调整条件权重，以平衡边缘(Canny)图与文本提示词的影响。
  - 微调此值以在结构保持和创意灵活性之间达到理想平衡。
FluxGuidance 节点：
- 目的：优化提示词对图像生成过程的影响。此节点调整“引导”参数，确定文本提示词与结构数据（边缘Canny图）的权重比例。
- 推荐值：通常推荐将引导值设置为 30.0，可以在结构保持和提示词驱动的创意之间提供良好的平衡。

节点组 3：Canny LoRA

Canny LoRA 节点组是标准 Canny 节点组的变体，使用 Flux.1-Canny-Dev-LoRA 模型。尽管 LoRA（低秩自适应）技术增强了边缘控制的灵活性，但其输出通常比标准 Canny 节点组稍低一些。不过，LoRA 组在某些特定场景中提供了独特的灵活性。

标准 Canny 与 LoRA 节点组的关键区别

特性	标准 Canny 节点组	Canny LoRA 节点组
使用的模型	Flux.1-Canny-Dev	Flux.1-Canny-Dev-LoRA
条件化方法	直接边缘基础条件化	LoRA 增强的边缘条件化
输出质量	高结构保真	结构保真稍低
适用场景	需要精确细节的任务	有灵活性需求的特定任务

节点组 4：深度处理

深度节点组使用 Flux.1-Depth-Dev 模型生成深度感知的图像变换。通过引入深度映射 (Depth)的空间真实感，此组能够保留和操作光照、阴影以及空间关系，非常适合需要逼真效果或深度引导编辑的任务。

节点设置与工作流程

深度节点组的结构与 Canny 节点组类似，但使用深度数据而非边缘(Canny)图：

加载扩散模型节点：
- 加载 Flux.1-Depth-Dev 模型。
- 模型文件必须存储在 models 文件夹下的 diffusion_models 目录中。
深度(Depth)图输入：
- 在基本设置组中生成的深度(Depth)图被传递到此组。
- 深度(Depth)图表示图像中对象之间的距离或空间关系，确保变换的真实性。

节点组 5：Depth LoRA

Depth LoRA 节点组采用了 Flux.1-Depth-Dev-LoRA 模型，利用 LoRA（低秩自适应）技术实现深度感知条件化。这种方法虽然在效率和灵活性上有所提升，但其输出质量和一致性可能不如标准 Depth 节点组。这使得它成为实验性工作流或需要轻量化处理和微调的场景中的一个备选方案。

标准 Depth 与 LoRA 节点组的关键区别

特性	标准 Depth 节点组	Depth LoRA 节点组
使用的模型	Flux.1-Depth-Dev	Flux.1-Depth-Dev-LoRA
条件化方法	直接深度条件化	LoRA 增强的深度条件化
输出质量	高一致性和真实性	稍低的质量，偶尔会出现不一致
灵活性	适用于严格的空间保持场景	更适合需要创意调整的场景

节点组 6：局部重绘（Inpainting）

局部重绘节点组使用 FLUX.1-Fill-Dev 模型，通过蒙版对图像的特定区域进行精确编辑。此组围绕 InpaintModelConditioning 和 Differential Diffusion 节点构建，这些节点专为优化局部重绘过程而设计，确保生成高质量的结果，并增强编辑区域与周围上下文的融合效果。

节点设置与工作流程

以下是局部重绘节点组的配置：

蒙版输入：
- 输入包括原始图像和定义需要编辑区域的蒙版。
- 蒙版区域是需要修改的部分，未遮盖的部分将被保留。
Load Diffusion Model (加载扩散模型节点)：
- 加载 FLUX.1-Fill-Dev 模型，专为局部重绘任务设计。
- 确保模型文件位于 models 文件夹下的 diffusion_models 目录中。
InpaintModelConditioning 节点
- 此节点使用变分自编码器（VAE）将输入图像编码为潜在表示，准备局部重绘所需的条件数据。
- 关键功能：
  - 对输入图像的未遮盖部分进行编码以保留上下文。
  - 引导模型填充蒙版区域，同时确保与周围图像对齐。
- 重要性：
  - 编码的条件数据确保编辑内容与图像其余部分自然融合，从而实现更平滑的过渡和更一致的结果。
Differential Diffusion 节点：
- 连接在 加载扩散模型 节点和 K采样器之间，此节点增强了局部重绘过程中的去噪处理。
- 关键功能：
  - 应用差分去噪蒙版，以改进编辑区域与未编辑区域的融合。
  - 实现软局部重绘，对蒙版区域的边界进行细微调整，以确保无缝过渡。
  - 注意遮盖边缘与未遮盖区域的平滑衔接，减少伪影和可见边缘。
- 重要性：
  - 避免了在蒙版边缘产生硬性过渡或不匹配，使局部重绘更自然。

节点组 7：扩图（Outpainting）

扩图节点组用于扩图图像的边界，同时保持图像的风格、上下文和整体构图。通过结合 FLUX.1-Fill-Dev 模型以及 InpaintModelConditioning 和 Differential Diffusion 节点，此组能够确保新生成区域与原始内容无缝融合。扩图特别适合于创建扩图场景、在主体周围生成额外背景或通过图像扩图增强创意叙事。

节点设置与工作流程

以下是扩图节点组的配置：

Pad Image for Outpainting (扩图图像画布)：
- 在将图像传递到此组之前，使用 Pad Image for Outpainting 节点定义需要扩图的区域。
- 功能：
  - 此节点通过在图像周围增加空白区域来增加画布大小，空白区域即为扩图目标。
  - 画布的大小和位置决定了扩图区域的范围和方向。
加载扩散模型节点：
- 加载 FLUX.1-Fill-Dev 模型以执行扩图。
- 与其他节点组类似，模型文件必须位于 models 文件夹下的 diffusion_models 目录中。

节点组 8：Redux 风格迁移

Redux 节点组为工作流引入了风格迁移功能，使用户能够在保持图像原始结构和上下文完整性的同时，应用艺术或美学上的变化。通过 FLUX.1-Redux-Dev 模型，此组结合了 Apply Style Model 节点和提示词条件化处理，为图像提供风格整合。

节点设置与工作流程

Load Style Model (加载风格模型节点)：
- 加载 FLUX.1-Redux-Dev 风格模型到工作流中。
- 风格模型文件必须放置在 models 文件夹下的 style_models 目录中。
- 此模型提供了用于修改图像美学的风格参考数据。
加载 CLIP Vision 节点：
- 加载 CLIP Vision 模型（sigclip_vision_patch14_384_safesensors）以处理视觉信息。
- 此节点将输入图像编码为潜在空间，使其与风格模型兼容。
Apply Style Model (应用风格模型节点)：
- 将风格模型与视觉编码（来自 CLIP Vision 节点）结合，生成风格条件。
- 此条件被传递到工作流的其余部分，以引导风格迁移过程。
Load Diffusion Model (加载扩散模型节点)：
- 加载主 FLUX.1-Redux-Dev 模型，处理结合的风格和文本条件化数据。

总结

Black Forest Lab 推出的全新 Flux 模型，构建了一套在 ComfyUI 中高度整合、功能强大的图像生成与编辑工作流。尽管这些模型性能强大，但仍存在一些局限：

需要像checkpoint一样加载：
- 这些模型类似checkpoint，需通过checkpoint加载器将它们集成到工作流中。这可能使得在单一工作流中结合 Flux 模型与其他checkpoint变得困难。
文件体积大：
- 某些模型的大小超过 20 GB，对存储空间要求较高。磁盘容量有限的用户可能需要对模型选择有所取舍。

尽管如此，这些限制并不是致命的。社区已展示出随着时间的推移不断优化模型的能力，例如 Flux 的早期版本最终推出了更轻量的 fp8 和 GGUF 版本。对于这些新模型，未来可能也会有类似的改进，包括进一步微调以提升输出质量、引入新风格或优化工作流以提高效率。

ComfyUI

在ComfyUI中用LoRA换脸，实现超高相似度

ByVito 2024年4月25日2025年1月21日

在之前的一篇文章中，我介绍了如何在WebUI中利用Adetailer插件和自己训练好的LoRA为图片中的人物换脸。本文将进一步展示如何在ComfyUI中执行类似操作。如果你喜欢看视频教程，那么我非常欢迎你观看本文所对应的视频(B站同名帐号)：准备工作首先，确保您拥有一个已经训练好的LoRA。如果你不知道如何训练LoRA，可以看看我之前的文章。这个LoRA可以仅使用被训练人物的大头照。我们的目标是使用LoRA生成与被训练人物高度相似的脸部，然后将其换到任何身体上，实现真正意义上的AI摄影。安装必要的自定义节点在开始之前，需要安装两个关键的自定义节点： 1️⃣进入ComfyUI，打开ComfyUI管理器。 2️⃣点击“安装自定义节点”的按钮。 3️⃣搜索“efficiency”并安装“Efficiency Nodes”。 4️⃣继续搜索“impact pack”并下载“ComfyUI Impact Pack”。 5️⃣安装完毕后，重启ComfyUI以确保所有节点正确加载。搭建基础工作流设置工作流 1️⃣双击打开搜索栏，输入“eff.”，找到并点击“Eff. Loader SDXL”。此节点整合了加载Checkpoint、VAE、提示词、设置图片尺寸等功能。 2️⃣再次打开搜索栏，输入“eff.”，选择“KSampler SDXL”作为采样器。 3️⃣将这两个节点相连，并正确设置Checkpoint和提示词。运行并测试图像 4️⃣现在，运行工作流并检查生成的图像，确保没有问题。添加换脸模块面部检测与分割 1️⃣双击打开搜索栏，输入“ultra”，选择“UltralysticsDetectorProvider”。它提供了一系列检测面部，手部，人体的模型。然后选择模型名称“bbox/face_yolov8m”进行面部检测。它用方形边界框来检测面部，比下面这几个检测面部的模型体积更大一些，因此效果更好一些。Bbox就是方形边界框”bounding box”的缩写。 2️⃣接下来，添加图像分割节点。打开搜索框，输入“samloader”，选择“SAMLoader”。这个”sam”就是”Segment Anything”的缩写，在WebUI里也有这个插件。它是Facebook的母公司Meta开发出来的图像分割的模型。接着选择模型名称包含字母“h”的模型。它是里面体积最大的，因此效果更好一些。实现换脸模型都准备好了，接下来还需要一个具体执行换脸的节点。 3️⃣搜索并添加“FaceDetailer”节点，类似于WebUI中的Adetailer。 4️⃣有了这3个节点还不够，因为我们还需要让这个”FaceDetailer”可以使用单独的模型以及提示词。还需要它可以使用我们训练好的LoRA进行换脸。所以，我们再添加一个支持SD1.5的效率加载器。 5️⃣我们需要对SDXL模型生成的图像进行换脸。所以采样器的图像输出端应该连上”FaceDetailer”的图像输入端。因为我们要”FaceDetailer”使用单独的模型，所以把效率加载器上的模型输出端连上”FaceDetailer”的输入端。下面的端口我们也连一下。然后把这两个处理面部的节点也连接一下。设置并预览 6️⃣配置“FaceDetailer”所需的模型、LoRA和提示词。 7️⃣在“FaceDetailer”的输出端添加一个预览图像节点。 8️⃣添加一个“把蒙版转化为图像”的节点，连接相应的“mask”端口。 9️⃣添加另一个预览图像节点以便预览处理好的面部蒙版。 🔟在SDXL的采样器图像输出端也添加一个预览图像节点，以便比较换脸前后的效果。接着再点击”添加提示词队列”按钮，稍等一会儿图片就出来了。调整与优化结束语至此，我们完成了在ComfyUI中使用LoRA进行人脸换脸的全过程。希望您能够利用这些技术，开启您的AI摄影创作之旅。如果您觉得这篇教程有帮助，请不吝点赞和关注，期待我们下次的分享。另外，给大家推荐我正在跑SD的云平台：https://myaiforce.com.cn/lanrui/

ComfyUI

升级版ComfyUI InstantID 换脸：FaceDetailer + InstantID + IP-Adapter

ByVito 2024年5月2日2025年1月21日

在使用ComfyUI的InstantID进行人脸替换时，一个常见问题是该工具倾向于保留原始参考图的构图，即使用户的提示词与之不符。例如，即使用户提供的是大头照并请求生成全身照，结果仍是大头照，没有显示出用户所期望的构图。同样，从半身照生成全身照的工作流也会遇到同样的问题——生成的图像仍然是半身照。为了克服这一挑战，我设计了一种新的工作流程，该流程可以将参考图中的人脸替换到任意一张照片上，而不受原始构图的限制。这种方法不仅提高了创作的灵活性，还确保了生成的图像能更好地符合用户的实际需求。接下来的内容，我们将详细介绍如何实现这一工作流程。如果你喜欢看视频教程，那么我非常欢迎你观看本文所对应的视频(B站同名帐号)：基础工作流的搭建首先，使用SDXL生成一张肖像照片。这张照片将作为换脸操作的基底图像。用于换脸的基底图像，你也可以用Midjourney生成，或者是你自己拍摄的照片。这样就非常灵活了。生成肖像照片 1️⃣ 准备工作：确保在ComfyUI管理器中安装了Efficiency Nodes效率节点。 2️⃣ 设置SDXL节点：换脸操作 3️⃣ 加载所需节点：在操作过程中，如果遇到任何疑问或需要进一步的详细说明，可以参考我之前发布的文章，里面使用了LoRA和FaceDetailer进行类似的换脸操作。添加并配置InstantID以进行换脸操作步骤 1: 安装和配置InstantID 1️⃣ 安装InstantID：在添加InstantID之前，您需要确保已经在ComfyUI管理器里安装了由cubiq开发的InstantID节点。这个节点是实现高质量面部替换的核心。 2️⃣ 配置节点：步骤 2: 准备参考图像 3️⃣ 上传参考图：步骤 3: 调整参数并连接 4️⃣ 连接节点： 5️⃣ 连接输出端口：开始换脸操作 6️⃣ 执行换脸：我们来对比下脸部参考图和换脸以后的图像。感觉有些不太像。很多情况下，再加入IP-Adapter可以提高一些换脸的相似度。我们来接着添加IP-Adapter。添加IP-Adapter以提高相似度步骤 1: 安装和配置IP-Adapter 1️⃣ 选择IP-Adapter节点： 2️⃣ 配置IP-Adapter FaceID模型： 3️⃣ 连接IP-Adapter：步骤…

ComfyUI

超简单 Flux 换背景工作流：结合最新 ControlNet 深度 Depth 模型

ByVito 2024年10月3日2025年1月21日

在本篇文章中，我们将深入探讨如何使用 Flux ControlNet Depth 模型进行换背景。这种方法是我之前基于 Flux 模型换背景工作流的简化版。虽然旧的工作流程功能强大，但它非常复杂且运行缓慢。今天，我们将学习一个更快速、更易用的替代方案。欢迎去B站观看本文对应的视频教程： Flux ControlNet Depth 模型的新特性这款由 Jasper AI 开发的全新 ControlNet 模型的最大优势是，它可以与现有的 SDXL ControlNet 节点和采样器兼容，无需专门的Flux ControlNet 节点。这大大简化了搭建过程，使其更容易集成到您的现有工作流中。关键优势：模型下载在开始之前，请从 HuggingFace下载 Flux ControlNet Depth 模型。下载后，请按照以下步骤操作：如果您在流程中看到某些节点缺失，只需安装它们即可确保所有功能正常运行。工作流程概览该新工作流程分为三个主要部分：整个流程大约包含 30 个节点，运行速度比以往更快。例如，在一张 3090 GPU 上，它可以在大约 1 分钟内生成一张图像。使用 Hyper LoRA 的 8 步图像生成甚至可以进一步提高速度！让我们先看看原始图像和使用此工作流更换了背景的图像：工作流程下载您可以在这里下载完整的工作流。在使用它之前，请确保已正确下载并配置 ControlNet Depth 模型。接下来，让我们逐步讲解每个部分的详细操作。第…

ComfyUI

ComfyUI产品摄影工作流(自定义产品位置并保留细节)

ByVito 2024年7月30日2025年1月21日

探索 ComfyUI 工作流程，制作出令人惊叹的产品摄影图片。学习如何通过完美的打光和细节来混合、重新照明和增强图像。

ComfyUI

AI换脸技术大比拼：PuLID vs InstantID vs FaceID

ByVito 2024年5月23日2025年1月21日

今天，我们将通过一个ComfyUI工作流来对比三种AI换脸技术，分别是PuLID、InstantID和IP-Adapter的FaceID-V2版本。这些技术的核心原理相似，都是基于一个名为InsightFace的人脸分析技术，该技术需要授权才能商用。InsightFace是一个深度人脸分析库，用于人脸识别、人脸检测和人脸对齐。 IP-Adapter FaceID是这三种技术中最早推出的。接下来推出的是InstantID。PuLID是最近推出的换脸技术。这三种方案都需要你提供一张人脸参考图。因此，换脸的效果在很大程度上取决于你提供的那张参考图的质量和适配度。接下来我们来通过一个ComfyUI工作流同时对比这三种换脸方式的效果。工作流的下载地址是：https://pan.baidu.com/s/19K60iNk1LGlNZJBCu7HuJA?pwd=lzo4 。我会先演示下如何使用这个工作流，然后用这个工作流生成4组图片，并进行打分，来评估它们的效果。如果你喜欢看视频教程，那么我非常欢迎你观看本文所对应的视频(B站同名帐号)：工作流配置和说明当你下载好相关节点并导入ComfyUI以后，可能会发现缺少一些节点。这时候只需要在ComfyUI管理器中安装这些节点并重启ComfyUI即可。建议在安装节点之前先升级ComfyUI，否则即使安装了节点，也可能仍然提示缺失节点。除了节点之外，还需要安装一些必要的模型。模型的下载地址和存放路径，可以在节点的GitHub主页上找到详细介绍。以最近的PuLID为例，安装说明中提到需要下载PuLID的预训练模型，然后将其放到ComfyUI/models/pulid/文件夹中。另外，第一次运行PuLID时，会自动下载一些模型。导入工作流以后，让我们从下往上看看它的结构。 1️⃣ 共享节点：最下面是PuLID、InstantID和FaceID共用的节点。它们使用的Checkpoint、提示词、潜空间图片的尺寸和固定的种子值是相同的，这样可以更有利于同时对比它们的效果。 2️⃣ 模型节点组：再往上，有三个节点组。从左到右依次是PuLID、InstantID和IP-Adapter-FaceID。工作流的作者将它们安排得井井有条，非常直观。 3️⃣ 参考图像节点：再往上，右击名称为”Face”的节点，通过右键菜单最上面的选项，可以发现它实际是一个”加载图像”的节点。这个节点加载的是一张有人脸的照片，用来给PuLID、InstantID和FaceID作为参考。运行工作流并对比效果了解了工作流的运行逻辑后，我们可以开始运行工作流，对比这三种换脸方式的效果。运行步骤 1️⃣ 确保所有必要的节点和模型都已安装和配置正确。 2️⃣ 导入工作流，并检查各节点的连接和配置。 3️⃣ 加载参考图像，并确认图像路径和格式正确。 4️⃣ 运行工作流，生成三种换脸技术的效果图。 5️⃣ 对比生成的效果图，分析PuLID、InstantID和IP-Adapter FaceID的差异和优劣。对比效果用这个工作流生成4组图片，并进行打分，来评估它们的效果。我设定了4个评分维度，为了方便起见，每个维度的分值都设定为1-3分：第一组图片： PuLID InstantID FaceID 提示词契合度 2 3 1 脸部光效 1 3 2 人脸相似度 1 2 3 脸部细节度 1…

ComfyUI

用区域裁剪实现更好的Flux局部重绘【ComfyUI工作流】

ByVito 2024年12月19日2025年1月21日

Hello 大家好，我是Vito。在本文中，我们将深入探讨一个先进的 ComfyUI 局部重绘工作流，旨在实现更大的灵活性和高效性。在我之前的文章中，我介绍了使用不同版本的 Fill 模型进行扩图和局部重绘的结果对比，以及一个实用的扩图工作流。今天，我们将重点关注局部重绘，特别是如何更换物品、修正扭曲的面部，甚至修复那些棘手的 AI 生成的手部。对于喜欢通过视频内容深入了解 ComfyUI 的朋友们，欢迎去B站查看配合本文的精彩视频教程：让我们开始吧！高度的通用性我开发的这个工作流具有高度的通用性，并且与量化模型配合使用效果良好，使其在显存使用上更加高效。无论你是修改细节，比如更换帽子或修复手部，这种方法都能帮助你以最小的麻烦实现高质量的结果。让我来详细展示如何使用这个设置。 1. 基础设置步骤1：加载模型首先，绕过其他节点组，激活第一个节点组，该组负责加载模型。我已经为你预先配置好了这一部分，所以我们可以直接运行工作流。组中的第一个节点加载 Fill 模型，这个模型既适用于扩图任务，也适用于局部重绘任务。在本次演示中，我使用的是量化的 Q5 版本模型 [1]。它只占用 8 GB 的显存，管理起来更加轻松。如果你的显存不足，可以选择 Q4 版本，只需 6.8 GB。经过我在之前的文章中验证，Q5 和黑森林实验室的 20 GB 模型在结果上的差异实际上非常小。你可以放心地使用这些较小的版本进行第一轮局部重绘。为了速度和效率，我在右侧的节点中添加了一个 Turbo LoRA [2]，以加快图像生成速度。 Fill 模型下方的节点 [3] 加载一个checkpoint。它决定了图像的最终质量。如果需要，你可以加载一个量化的checkpoint，如 FluxRealistic，它只需要 6.8 GB 的显存，但仍然能提供良好的质量。这里还有另一个 Turbo LoRA 节点 [4]，但我将其强度设置为零，因为在这个阶段它不是很有用。你可以在稍后的任务中，比如修复面部或手部时再回来使用它。步骤2：限制图像大小…

功能与工具概述

1. Fill 模型：局部重绘与扩图的强大引擎

2. 结构化控制：Canny 和 Depth

3. Redux 模型：革新风格迁移

工作流设置

工作流结构

模型安装

节点组 1：基本设置

1. 基本设置组的核心组件

2. Clip 和 VAE 设置

3. 图像预处理

4. Canny 边缘处理

5. 深度(Depth)图处理

节点组 2：Canny 边缘检测

节点设置和工作流程

节点组 3：Canny LoRA

标准 Canny 与 LoRA 节点组的关键区别

节点组 4：深度处理

节点设置与工作流程

节点组 5：Depth LoRA

标准 Depth 与 LoRA 节点组的关键区别

节点组 6：局部重绘（Inpainting）

节点设置与工作流程

节点组 7：扩图（Outpainting）

节点设置与工作流程

节点组 8：Redux 风格迁移

节点设置与工作流程

总结

Similar Posts

Leave a Reply Cancel reply