Stable Diffusion 必装插件之 ADetailer，修脸修手无敌，各种参数详解

ByVito 2024年1月19日2024年1月19日

如果你经常用 Stable Diffusion 画人物，相信你一定画出过脸崩的图片。这也是目前文生图 AI 工具普遍存在的问题。连 Midjourney V6 也不例外！当它画一个人的时候表现还好，当画面里的人一多，局面就难以控制了。

看，这就是 Midjourney V6 生成的图片。各种扭曲变形，是不是令人大跌眼镜？

单人肖像在 Stable Diffusion 中可以局部重绘一下，要是人数多呢？值得我们为修复一张图片花费几个小时的时间吗？幸运的是，我将为你介绍一个非常强大的插件。它就是为一次性快速修复这样的问题准备的。绝对是 Stable Diffusion 必装的一款插件。

很多人没有用过 Stable Diffusion 的原因是显卡不给力。其实可以租用云平台来跑 SD，按小时收费也很划算。感兴趣的话，可以看看我的这篇文章：

👉 玩 Stable Diffusion 没有好显卡？试试秋叶大佬推荐的云平台

ADetailer 值得我花很多时间，与你们分享。本文包含的内容非常丰富，从插件的安装，到各种参数的详细介绍。耐心看完的话，一定能成为高级玩家。OK，让我们开始吧。

Table of Contents

安装

首先我们来看如何安装这个插件。

安装 ADetailer 的方法和安装其他插件一样。首先来到插件的标签页，然后点击“可用”标签页。接着在 “Search” 文本框内输入 “adetailer”。通常情况下，它会出现在下方的列表里，然后点击安装即可。

如果没有出现的话，还有第二种方法，那就是利用“可用”标签页右边的标签页“从网址安装”。这个网址可以从这个项目的 Github 网页获得。我们可以在搜索引擎上输入关键词 “adetailer stable diffusion”，通常这个网页在搜索结果中排名第一。或者直接在浏览器地址栏输入网址。

到了 Github 网页(https://github.com/Bing-su/adetailer)以后，点击 “Code” 按钮，在弹出的窗口中点击 “复制url到剪贴板”按钮。这时候网址就被复制到了剪贴板上。

ADetailer 的 GitHub 页面里详细介绍了安装过程和解决问题的方案。大家也可以仔细去看一下。某些模型可能需要单独下载并移动到 “webui/models/adetailer “文件夹。

复制网址后，让我们回到 WebUI，把网址粘贴进来，然后点击“安装”按钮。

切换到“已安装”的标签页，点击“应用并重启用户界面”。

接着回到 WebUI 文生图或图生图的界面，就可以看见 ADetailer 出现在列表中啦。

演示操作

安装完成以后，我们就可以体验它神奇的效果啦。

首先，我在不用这个插件的情况下，生成一张图。这里使用的是文生图，当然，ADetailer 也可以在图生图中发挥作用。

这里我使用的是真实系模型 MajicmixRealistic 。大家可以根据自己的喜好选择相应的模型。其中的很多参数我遵循了模型作者的推荐，比如 Clip skip 我设置的是 “2”，采样器我选择的是 “Euler a”。

不出意外的话，生成的照片是有很多问题的。

最前面的女孩还好，但后排女生的脸就开始出问题了。画面中越远或者越小的人脸越容易出问题。这么多脸要是用局部重绘一个个去修复的话，肯定得累死。

感谢 ADetailer 的作者为我们提供解决方案。

接下来我们固定一下随机种子。然后展开下方的插件 ADetailer 。我们发现这里有好多模型可供选择，令人眼花缭乱。我们就先来一个默认的，其他的模型我稍后会做讲解。勾选这个插件以后，然后重新生成。

我们通过预览窗口会发现，生成图像的过程变得不一样了。几乎每张脸的周围都多了一个红色的方框，上面还有数字。

还能在预览窗口中看到每张脸的特写。这实际上是 ADetailer 插件正在处理一个个人脸。

处理完成之后，图片就出来了。仔细看看，这些人脸是不是改善很多呢。

让我们回过头来看看原图。这是原图。

如果看不出来区别的话，我为你做了一张放大后的对比图。仔细看的话，远处的人脸也被一一修复了呢。

模型解释和对比

为了生成刚才的图片，我们无脑选择了默认的模型，也就是 face yolo v8n。实际上，ADetailer 为我们提供了相当多的模型。我数了一下，目前竟然有 14 个之多。

看到这么多模型，是不是会犯选择困难症呢？没关系，让我来为大家讲解它们的区别。然后再展示它们生成的对比图。理性加感性，这样就没问题啦。

从处理图像的区域来划分，这些模型分为三类。模型名称里包含 face 的就是用来处理面部的。包含 hand 就是处理手的。包含 person 就是处理身体的。deepfashion 比较特殊，我们先不讲。

从处理图像使用的模型划分，这些模型分为两类。模型名称里包含 YOLO 的就是使用了 YOLO 算法。包含 MediaPipe 就是使用了 MediaPipe 算法。

目前 ADetailer 所有的 MediaPipe 模型都是用来处理面部的，尽管 MediaPipe 本身还可以处理手。

MediaPipe 提供专门的人脸检测模型，并对性能和准确性进行了优化。YOLO 算法则更具有通用性，它可以检测各种物体。在 ADetailer 中，它还可以检测身体，还适用于二次元的模型。MediaPipe 则适用于写实模型。

和YOLO相比，它可能会对人脸特征提供更高的准确性，而 YOLO 的准确性取决于其训练和版本。

图中的方框就是它们处理的区域。从图片里也可以看出来，MediaPipe 处理的区域更小，但更精确。它在处理过程中对面部多个特征都做了标注。

但它也有缺点。如果是侧脸，或者脸部在画面占比小的话，MediaPipe 就无法处理。因此它能处理的面部是非常有限的。YOLO 则能一次处理大量的人脸。从图片里也可以看出，YOLO 处理的区域更大，甚至能处理头发和背景。

为了便于大家记忆，我做了一张表格。

接下来我们分开来解释 YOLO 和 MediaPipe。

目前基于 YOLO 的模型有 10 个。基本都以”.pt” 结尾，这个是文件类型，不用管它。

文件名中的数字代表版本。目前是第 8 个版本。版本号后面跟着的字母”s”、”n”和”m” 代表模型的大小。”s”代表小型 small，”n”代表纳米 nano，比小型更小。”m”代表中型 medium。模型越小，处理速度越快，代价就是精度更低。大家可以考虑速度和精度来选择相应的型号。

根据我的解释，”v8n”和”v8m”应该是YOLO系里面差异最大的两个模型。让我们看看它们的对比图。

细看之下，差异也挺明显的。”v8m”比”v8n”看上去细节更好。

接下来我们聊一下 MediaPipe，分为 4 个版本，分别是”full”、”short”、”mesh”和”mesh_eyes_only”。

为了让大家更直观地理解，我把 MediaPipe 这几个模型出图的过程放在一起，做了一张对比图。

先来看上半部份，full和short的区别。顾名思义，full就是完整的意思，而short就是短小精悍。full 模型对面部的检测更全面。蓝色的点就是模型检测到的面部特征，full 对最右边女生的面部检测点比 short 要多。同时，full 检测到了 3 张人脸，而 short 只检测到了最右边女生的脸。

mesh 就是网的意思，顾名思义，它会把面部标记为一个网，因此对面部的检测更全面和立体。它更善于分析面部表情。mesh_eyes 则只检测眼睛的部分，适合对眼睛做更精细的修复。

大家对比下，mesh 处理后的面部是不是比 full 更有立体感，更精细呢。

大家可能会想，我之前用来对比的显示方框和数字的图是如何生成的。让我回到WebUI为你揭晓。

点击设置。

在左边一系列选项中找到 ADetailer 并点击，就来到了 ADetailer 的设置界面。

勾选”Save mask previews“就可以让 ADetailer 为你保存一张显示处理过程的边界框的图片。

勾选”Save images before ADetailer“则会生成一张没有用 ADetailer 处理过的图片。

在生成图片的文件夹里就可以看到这两张图。文件名里包含”ad-before”就是处理前的图片，包含”ad-preview”的就是显示处理过程的边界框的图片。

Max models 控制的是 ADetailer 可以同时运行的模型数。比如要同时修复脸和手，可以分别选择一个修脸和一个修手的模型。

我这里选择了3个模型，来给大家演示下效果。要使得刚才更改的所有设置生效，得先点击”应用设置“，然后点击”重新加载WebUI“。

这时候当我们回到文生图的界面，找到 ADtailer 插件的界面，就可以看见3个标签页，”1st“，”2nd“，”3nd“。在这3个标签页中，我们可以分别选择模型，并进行相应的设置。

其他参数效果

讲完了各种模型，相信你应该明白了在何种情况下应该选择使用哪个模型。然而，光了解各个模型还不够，ADetailer 还提供了各种设置选项和参数，让我们一起研究下，成为高级玩家吧。

回顾一下刚才用 ADetailer 生图的过程，会发现其实 ADetailer 里面竟然还可以填写提示词。

那么这里的提示词有什么作用呢。

比如我生成了这样一张图片。

接着，让我们往 Adetailer 里面添加提示词。

正向提示词是 glasses 眼镜，反向提示词是 smile 微笑。来看看图像发生了怎样的变化。

多了一幅眼睛，少了一脸笑容。你是不是瞬间明白了 Adetailer 里面的提示词是干嘛的了呢？

好的，接下来让我们继续看另外一个参数，Detection model confidence threshold 检测模型置信度阈值。这是什么意思呢？比方说，我把它调到了 0.85，让我们来看看会发生什么。

看到了吗，只有高于 0.85 的脸被检测到了。这就是阈值的作用。

我们再来看一个比较常用的参数，Inpaint denoising strength 重绘去噪强度。把它调到 0.8，看看会发生什么。

结果变成了恐怖片。重绘去噪强度说白了就是对重绘区域的改动幅度。0.8 这个数值太大，一般设置为 0.6 以下。

再看一个参数。让我们把xxx调回默认值 0.4，然后把 “Inpaint mask blur (重绘遮罩模糊)” 调到 0 会发生什么。

这是生成的图片。

如果不仔细看的话，可能看不出什么区别。

让我们把图片转为黑白，再调整一下对比度。如果你仔细看得话，会发现这里有明显的接缝。

因为 ADtailer 是对矩形边界框内的人脸进行修复，如果模糊度设置的太低，那么边框内和边框外的像素就无法很好的融合，导出出现比较生硬的接缝。

如果把重绘遮罩模糊调整为 50 的话，图片是这样的。放大来看，会发现这个女生的脸实际上并没有被修复。

这是因为如果数值过高的话，实际上矩形边界框就消失了。ADtailer 将无法检测到人脸。

OK，以上就是本期内容，喜欢的话就点个赞吧。

SD WebUI

如何训练一个非常像的真人LoRA

ByVito 2024年3月22日2024年3月22日

在本篇文章中，我们将探索如何训练一个能够将喜爱的人物置入任何场景中并实现高度一致性的LoRA模型。借助LoRA，我们能够创造出极为逼真的人物图像，就如同我为斯嘉丽训练的LoRA模型所展示的那样。那么，让我们一起深入了解如何训练LoRA。如果你喜欢看视频教程，那么我非常欢迎你观看本文所对应的视频(B站同名帐号)： Kohya训练器在多种工具中，Kohya训练器因其全面的功能——不仅限于训练LoRA，也包括DreamBooth和Text Inversion——而广受欢迎。国内也有一些开发者制作出了一些好用的训练器，比如赛博丹炉和秋叶丹炉。它们的原理和Kohya一样，设置好参数以后，最终都会转化为脚本进行训练。所以说，掌握了Kohya训练器以后，其他的训练器也不在话下。安装Kohya相对简单，其详细的安装指南可在项目的Github主页(https://github.com/bmaltais/kohya_ss)找到。此外，B站的知名UP主Nenly也提供了一份详细的安装攻略(https://gf66fxi6ji.feishu.cn/wiki/Q4EYwQl2riWw25kdN3hc5xuEnIe)，非常值得参考。 LoRA训练流程训练LoRA的流程包括以下几个关键步骤： 1️⃣ 准备数据集：选取适合训练的图片。 2️⃣ 图片预处理：进行裁剪和打标，为图片添加合适的标注或提示词。 3️⃣ 设置训练参数：在Kohya训练器中进行参数设置。 4️⃣ 开启训练：通过命令行查看训练进度。 5️⃣ 测试训练结果：挑选出效果最佳的LoRA文件进行测试。 LoRA训练的底层逻辑为了解决可能出现的疑惑，本段落将深入解释LoRA训练的底层逻辑。通过深入了解这一过程，您将能更清晰地把握如何训练出一个高质量的LoRA模型。 LoRA训练概述 LoRA模型的训练目标是生成的图片与原训练图像高度相似。这是通过在Diffusion模型上添加额外权重来实现的，这些权重被保存在一个称作LoRA文件的单独文件中。可以将LoRA文件视为Diffusion模型的一种插件，这种插件会根据训练过程不断调整权重，以达到与原始训练图相似的效果。训练过程详解通过上述步骤，LoRA模型的训练涉及到精细的权重调整和优化，确保了生成图像与原始训练图之间的高度相似性。希望这一解析能帮助您更好地理解LoRA模型的训练机制。正式开始LoRA训练：以斯嘉丽为例在理解了LoRA训练的底层逻辑后，我们现在可以开始实际的训练过程了。本次我们将以众所周知的好莱坞明星斯嘉丽·约翰逊为例，展开训练。下面是详细的步骤和一些建议，希望能帮助你顺利完成LoRA模型的训练。第一步：准备训练集成功的LoRA训练起始于高质量的数据集。以下是一些建议，帮助你准备一个合格的训练集：选择合适的图片作为训练集是至关重要的第一步。优质的数据集直接影响训练结果的质量。第二步：图片预处理裁剪为了让AI更好地学习人物的脸部特征，建议以1比1的宽高比进行裁剪，主要聚焦于头部区域。稍微包含一些肩膀部分也是可以的。这样的裁剪策略有助于生成更加逼真的LoRA图像。这样可以让AI充分学习人物的脸部特征，生成的LoRA也更像。如果到时候我们训练出的LoRA生成的图片只有大头照也没关系，因为我们可以先生成其他人物的全身照，然后用LoRA生成的大头照进行换脸。这几张斯嘉丽的图片我就是这样生成的。灵活度很高，想要什么风格就什么风格。放大鉴于许多在线图片的分辨率较低，裁剪后的图片分辨率可能进一步降低。因此，我们推荐将图片放大至至少512×512的分辨率。如果条件允许，可以考虑放大到768×768。图片放大不仅可以提升图片细节，还能丰富训练过程中的学习材料。放大完以后，我们就可以进行最终裁剪啦。上篇文章(https://myaiforce.com.cn/text-inversion/)中，我给大家推荐了一个非常好用的在线裁剪工具，感兴趣的话可以回顾一下。第三步：打标通过遵循上述步骤，你将能够为LoRA训练准备好高质量的数据集，并进行有效的预处理。这样的准备工作是成功训练LoRA模型的关键。希望这些指导能帮助你顺利进行训练，并创造出令人印象深刻的人物图像。 LoRA训练核心参数详解在图片处理完成之后，我们将进入Kohya训练器的设置阶段，这一阶段是LoRA训练过程中至关重要的一步。接下来的指南将帮助您熟悉Kohya训练器的界面和必要的设置选项，确保您的训练顺利进行。选择预训练模型设置训练项目文件夹 1️⃣训练模型输出名称：为训练好的LoRA文件命名。这一步骤对于后续的测试和使用非常重要，确保您能够轻松识别和调用不同的训练结果。 2️⃣图片文件夹路径：需要指定一个包含训练图片的文件夹。这里存放的是您预处理后用于训练的图片，确保路径设置正确。 3️⃣LoRA文件输出路径：指定LoRA训练结果存放的位置。这个文件夹将用于保存训练过程中生成的LoRA文件，方便后续测试和使用。 4️⃣训练日志文件夹路径：设置一个文件夹用于存放训练过程中生成的日志文件。这对于监控训练进度和调试可能出现的问题非常有帮助。其他设置新建训练项目文件夹填这些路径之前，首先得新建一个训练项目的文件夹。 1️⃣新建项目文件夹：首先，创建一个新的训练项目文件夹，例如命名为scarlett_johansson。重要提示：为了避免潜在的问题，请确保文件名不包含中文字符或空格。 2️⃣创建必要的子文件夹：在项目文件夹内部，需要创建三个子文件夹，分别命名为image、models、和log。这些文件夹分别用于存放训练数据集、输出的LoRA模型文件以及训练日志。 3️⃣添加数据集和打标文件：在image文件夹下，进一步创建一个用于存放具体数据集和打标文件的子文件夹，如25_ScarlettJohansson。这里的25代表对每张图片进行的重复训练次数（Repeats），建议设置在10到30之间。文件夹名称的其余部分应反映训练的概念或主题，例如人物的姓名。…

SD WebUI

使用LoRA的最佳方式：ADetailer+LoRA换脸

ByVito 2024年3月27日2024年3月27日

在上一篇文章中(https://myaiforce.com.cn/real-life-lora-training/)，我分享了如何为好莱坞女明星斯嘉丽训练一个高度相似的LoRA模型。我专门选用了斯嘉丽的大头照进行训练，以便AI能够集中精力学习她的脸部特征，从而生成的图片与本人高度相似。然而，当尝试生成半身或全身照时，我们会遇到一些挑战。比如我用这个提示词，并且把LoRA添加进去，生成的图片和斯嘉丽本人并不像。而且，因为我训练LoRA使用的是SD1.5的底模，所以我只能用基于SD1.5的模型来生图。本篇文章旨在介绍如何利用ADetailer插件克服这些挑战，让你训练的LoRA模型可以自由使用任何底模，生成不同风格的照片。它实际上就是单独把人脸从图像中分离出来，然后用LoRA生成的大头照进行换脸。看，这是我用来换脸的3张原始图片。这是我用斯嘉丽的LoRA换脸之后的图片。效果还不错吧。接下来让我来演示如何操作。如果你喜欢看视频教程，那么我非常欢迎你观看本文所对应的视频(B站同名帐号)： LoRA+ADetailer换脸步骤让我们详细了解如何通过几个简单的步骤使用ADetailer进行换脸操作：一、准备阶段首先，确保你已安装ADetailer插件。如果你不熟悉如何操作，我之前的文章中有详细的安装和使用指南(https://myaiforce.com.cn/stable-diffusion-adetailer/)。二、上传图片并选择配置：访问WebUI的图生图界面，这是开始我们换脸操作的地方。三、设置采样器与采样步数四、调整图像尺寸与其他参数五、配置ADetailer插件六、精细调整与生成七、使用不同的底模进行换脸八、生成与调整换脸图片一旦你完成了ADetailer插件的所有配置，点击“生成”后，换脸过程便正式开始。以下步骤将帮助你理解生成后的预览，以及如何根据预览结果对换脸区域进行微调，确保最终效果达到满意标准。查看与调整换脸区域 1️⃣ 生成预览：在点击“生成”按钮后，系统会根据你之前的设置开始处理图片。处理完成后，在预览窗口中，你将看到原图的人脸周围出现了一个方框，这个方框标识了换脸的具体区域。 2️⃣ 调整换脸区域大小：如果你觉得自动生成的换脸区域大小不够精确或需要调整，可以轻松修改。只需展开“蒙版预处理选项”，然后调整滑块来增大或缩小换脸区域。这一步骤允许你细致地控制换脸的范围，确保换脸效果的自然和谐。优化换脸效果在查看生成的换脸图片后，如果你发现效果未达到预期，可以通过调整ADetailer的降噪强度来进行优化。适当调整降噪强度可以帮助平滑脸部区域与原图的融合。使用ADetailer插件进行文生图换脸值得一提的是，ADetailer插件不仅可以在图生图中使用，也同样适用于文生图。这意味着你可以直接在文生图环境下生成一张图片，然后使用ADetailer进行直接换脸。操作方法与在图生图中大致相同，提供了一个灵活而强大的工具，让你的创作不受限于特定的环境或模式。结论通过本篇文章，你应该已经掌握了如何利用ADetailer插件和LoRA模型进行高质量的换脸操作。这不仅可以让你的LoRA模型跨越原有的限制，还能创造出各种惊人的效果。希望这篇教程对你有所帮助，感谢阅读！最后，给大家推荐我正在跑SD的云平台：https://myaiforce.com.cn/lanrui/。

SD WebUI

Text Inversion: 比 Lora 更简单地训练人脸【Stable Diffusion 炼丹教程】

ByVito 2024年2月28日2024年2月28日

Stable Diffusion的最大魅力体现在其DIY的能力上。它不是什么图都能画出来，但是我们可以根据自己的需求，训练它成为我们想要的样子。其中，Text Inversion 就是一种最简单有效的训练方式。它比 Lora 训练更简单，对数据集的要求比较低，适合入门。它的训练过程和 Lora 有很多共通的地方，熟练掌握的话对于后期 Lora 训练也是很有帮助的。和 Lora 一样，它也可以用来训练任何人脸，生成任何人的照片。其实，早在一年以前，就有很多关于它的教程。然而，那时的 WebUI 跟现在的有所不同，可能会让你感到困惑。而且，之后还出现了一些新的处理数据集的方法。所以，我觉得有必要写一篇新的文章，让大家从原理层面深入了解 Text Inversion。在这篇教程中，我会用著名好莱坞女明星 Angelina Jolie 的照片进行训练。有人可能会问，Angelina 是个名人，Stable Diffusion 训练过她的照片。那么我再为她训练 Embedding 有什么意义呢？如果你喜欢看视频教程，那么我非常欢迎你观看本文所对应的视频(B站同名帐号)：让我来解释一下。我们都知道，Stable Diffusion 是用网络上公开的6亿张包含描述的图片训练而成的。这些图片的质量都不太高，而且未必符合我们心目中的 Angelina 的形象。如果我们要生成自己心目中 Angelina 的样子，就可以筛选出我们喜欢的照片，然后用它们来进行训练。这才是训练的真正意义。看，下面是训练前后的对比图片。左边这列是原版的Angelina。右边是我训练的Angelina。它们的区别还是挺大的吧。接下来，我将一步步引导大家通过实例学习Text Inversion的训练过程，包括数据集的准备、图片的预处理、训练过程以及测试训练结果。数据集的准备训练开始前，数据集的准备是至关重要的一步，它直接影响到最终生成图像的质量。遵循以下两个原则以确保数据集的质量：推荐至少准备10张以上的面部图像，并可以包含一些上半身或全身照片，以学习人物的体型和姿态。注意，图片中不应包含水印，以避免影响最终结果。看，这是我用不同质量的数据集生成的效果。左边这列的是用质量比较差的数据集，跟右边的效果还是有差距的吧？图片预处理图片准备工作完成后，接下来的重要步骤是进行图片的预处理，包括裁剪和打标，以确保所有图片都有统一的分辨率，推荐尺寸为512×512。这一步骤对于提高训练效果和最终图像的质量至关重要。以下是详细的预处理步骤： 1️⃣ 选择合适的工具：由于新版本的WebUI已经移除了“图片预处理”功能，因此需要借助外部工具进行预处理。我在这里推荐一个在线批量处理图片的网站，使用起来非常方便。网址是： 2️⃣ 上传图片： 3️⃣ 自动裁剪和焦点检测：…

SD WebUI

这个 Stable Diffusion 新模型换脸效果真不错！

ByVito 2024年2月3日2024年2月3日

ControlNet 是 Stable Diffusion Web UI 中功能最强大的插件。基于 ControlNet 的各种控制类型让 Stable Diffusion 成为 AI 绘图工具中最可控的一种。 IP Adapter 就是其中的一种非常有用的控制类型。它不仅能够实现像 Midjourney 一样的“垫图”功能，还能用来给肖像人物换脸。 IP Adapter 的很多老的模型都可以用来换脸，如 Plus Face。然而，IP Adapter 不断推出了更新的模型，持续为我们带来惊喜。通过我的亲身测试，我发现新的 Face ID Plus V2 模型在换脸效果上远胜以往。我尝试将好莱坞女星 Angelina Jolie 的脸部特征融合到了由 Midjourney 生成的多个图片中，包括一名中世纪女战士、一幅文艺复兴时期的美女肖像，以及一位女王的形象，效果都非常令人满意。怎么样？效果还不错吧？接下来我来介绍如何在 Web UI 中安装并使用这个模型。如果你喜欢看视频教程，那么我非常欢迎你观看本文所对应的视频(B站同名帐号)：准备工作我们主要利用 Control Net 中的 IP Adapter 来进行换脸，同时使用 OpenPose 保持原图人物的头部姿势。相对于 Control Net…

SD WebUI

如何在WebUI中给人物换发型：两种方法详解

ByVito 2024年4月17日2025年1月21日

大家好！今天，我们将探讨在WebUI中给人物换发型的两种有效方法。这个过程利用了Stable Diffusion的文生图和局部重绘。接下来，我将一步步带你了解每种方法的操作流程和关键细节。如果你喜欢看视频教程，那么我非常欢迎你观看本文所对应的视频(B站同名帐号)：方法一：使用文生图和ControlNet 首先，让我们从文生图开始。假设我们已经有了一张图片（这里使用的是Stable Diffusion生成的）。这使得我们可以轻松地发送提示词进行图像生成或局部重绘。步骤概览 1️⃣ 模型和尺寸设置： 2️⃣ 使用ControlNet进行局部重绘： 3️⃣ 调整和生成：总结：方法二：使用图生图和专门模型第二种方法是使用专门为局部重绘训练的juggerxlinpaint模型，操作起来相对简单而且效果出众。步骤概览 1️⃣ 准备和设置： 2️⃣ 涂抹和输入提示词： 3️⃣ 调整和生成：总结：以上就是在WebUI中给人物换发型的两种方法。希望这些信息对你有帮助！如果觉得有用，欢迎点赞支持。

SD WebUI

超高相似度换脸：IP-Adapter+Instant-ID一起上

ByVito 2024年3月31日2024年3月31日

在上一篇文章中，我们探讨了如何使用LoRA模型和Adetailer插件来实现换脸效果，达到了与斯嘉丽本人极高的相似度。如果您对训练真人LoRA模型感兴趣，欢迎回顾我之前的文章。尽管LoRA模型的效果卓越，但其训练过程较为复杂。因此，本篇文章将向您介绍一种无需LoRA即可实现高相似度换脸的方法。我使用这种方法得到的换脸效果虽然相较于LoRA有微小的下降，但整体表现依然出色。众所周知，ControlNet中的IP-Adapter和Instant-ID可以用于换脸，但有时它们的相似度不够高。我将介绍的方法结合了这两者的优势，比单独使用它们能够获得更高的人脸相似度。如果你喜欢看视频教程，那么我非常欢迎你观看本文所对应的视频(B站同名帐号)：另外，我在这个云平台上运行SD，推荐一下： WebUI Forge的介绍本篇文章将使用WebUI的进阶版本——WebUI Forge。相比于旧版WebUI，WebUI Forge在性能上有显著提升，甚至超过了ComfyUI，并增加了许多实用的新功能。例如，ControlNet引入了新版的IP-Adapter，预处理器也有所不同。 Instant-ID的预处理器也跟老版本的WebUI里的不一样。这些变化是我们选择WebUI Forge的原因之一。我发现，在老版本的WebUI中同时使用IP-Adapter和Instant-ID的效果非常差。要安装WebUI Forge的话，可以访问其GitHub主页(https://github.com/lllyasviel/stable-diffusion-webui-forge)。上面有详细的安装步骤。我为大家下载了一键安装包。下载地址是https://pan.baidu.com/s/1HGp5eYb-a0OsRrNOOO5sTg?pwd=j425。解压之后，使用run.bat这个文件来运行，使用update.bat这个文件来更新。保持更新很重要，可以避免老版本的Bug。换脸基础设置 1️⃣选择SDXL底模首先，打开WebUI Forge的界面，我们需要选定一个SDXL的底模作为我们的起点。选择SDXL模型是因为Instant-ID当前仅对此模型提供支持，确保了我们能够利用最新技术实现换脸。 2️⃣局部绘制和上传照片接着，进入到图生图的界面，并选择“局部绘制”选项。这一步骤是准备将我们想要进行换脸的照片上传至平台。上传照片后，涂抹脸部区域以指定将要更换的部分。记得，涂抹的区域应略大于实际的脸部区域，以便我们有足够的空间调整人物的脸型，这是一个关键步骤，确保最终效果的自然和谐。 3️⃣调整蒙版模糊度和使用Soft Inpainting 完成脸部区域的标记后，滚动到页面下方进行进一步的设置： 4️⃣填写提示词和选择采样器 5️⃣调整宽高和重绘强度最后，点击“三角尺”图标自动将宽高设置为原图尺寸，以保持图像比例的一致性。同时，适当调低“重绘强度”以确保换脸后的脸部与原图能够自然衔接。重绘强度设置过高可能导致不自然的效果，因此，根据生成的图像再做微调是非常必要的。在成功安装并进入WebUI Forge界面后，接下来的步骤是配置ControlNet以实现精确的换脸效果。ControlNet的设置是核心过程之一，涉及到IP-Adapter和Instant-ID的应用。这部分指南将详细介绍如何正确配置ControlNet以及相关组件。设置第一个ControlNet（使用IP-Adapter） 1️⃣启用ControlNet：首先，展开“ControlNet Integrated”选项，并启用第一个ControlNet。 2️⃣选择IP-Adapter：在ControlNet配置中，选择IP-Adapter作为工具。预处理器和模型应已预设选择，无需进一步配置。如果你没有这个模型的话，可以看看我之前介绍IP-Adapter的文章。 3️⃣上传控制图像：勾选“Upload independent control image”并上传一张斯嘉丽的大头照作为参考。选择适当的头像至关重要，因为不同的头像可能会直接影响换脸效果的质量和准确性。 4️⃣调整权重：向下滚动并适当调整权重。需要注意的是，没有固定的权重设置标准，需要根据具体情况和效果进行调整。 5️⃣添加LoRA提示词：在提示词区域添加LoRA，以配合IP-Adapter使用。虽然这对最终效果的影响不大，但适当的调整可以微调细节。设置第二和第三个ControlNet（使用Instant-ID）继续设置第二个和第三个ControlNet，这些步骤是为了使用Instant-ID技术优化换脸效果。这部分配置关键在于下载和安装正确的模型，以及精确地调整设置以适应特定的换脸需求。下载和安装Instant-ID模型 1️⃣访问GitHub页面：所有必要的模型下载链接和安装指南都可以在指定的GitHub页面(https://github.com/Mikubill/sd-webui-controlnet/discussions/2589)上找到。这些信息提供了详细步骤，确保用户能够顺利进行配置。 2️⃣下载模型：根据链接直接下载所需的Instant-ID模型。或者，访问我提供的度盘链接：https://pan.baidu.com/s/1dfX4v9O1uGZALsHpnDolHA?pwd=hjk2。 3️⃣模型重命名与放置：设置第二个ControlNet 1️⃣启用ControlNet：在WebUI Forge界面中，展开第二个ControlNet的设置，并勾选启用。 2️⃣配置选项：设置第三个ControlNet 1️⃣预处理器选择：选择InsightFace (Instant-ID)，这是另一种用于识别脸部特征的预处理器。 2️⃣模型选择：此处选择ip-adapter_instant_id_sdxl模型，确保与第二个ControlNet的配置相互补充。…

安装

演示操作

模型解释和对比

其他参数效果

Similar Posts

Leave a Reply Cancel reply