SD WebUI

如何训练一个非常像的真人LoRA

ByVito 2024年3月22日2024年3月22日

在本篇文章中，我们将探索如何训练一个能够将喜爱的人物置入任何场景中并实现高度一致性的LoRA模型。借助LoRA，我们能够创造出极为逼真的人物图像，就如同我为斯嘉丽训练的LoRA模型所展示的那样。

那么，让我们一起深入了解如何训练LoRA。

如果你喜欢看视频教程，那么我非常欢迎你观看本文所对应的视频(B站同名帐号)：

Table of Contents

Kohya训练器

在多种工具中，Kohya训练器因其全面的功能——不仅限于训练LoRA，也包括DreamBooth和Text Inversion——而广受欢迎。

国内也有一些开发者制作出了一些好用的训练器，比如赛博丹炉和秋叶丹炉。它们的原理和Kohya一样，设置好参数以后，最终都会转化为脚本进行训练。所以说，掌握了Kohya训练器以后，其他的训练器也不在话下。

安装Kohya相对简单，其详细的安装指南可在项目的Github主页(https://github.com/bmaltais/kohya_ss)找到。

此外，B站的知名UP主Nenly也提供了一份详细的安装攻略(https://gf66fxi6ji.feishu.cn/wiki/Q4EYwQl2riWw25kdN3hc5xuEnIe)，非常值得参考。

LoRA训练流程

训练LoRA的流程包括以下几个关键步骤：

1️⃣ 准备数据集：选取适合训练的图片。

2️⃣ 图片预处理：进行裁剪和打标，为图片添加合适的标注或提示词。

3️⃣ 设置训练参数：在Kohya训练器中进行参数设置。

4️⃣ 开启训练：通过命令行查看训练进度。

5️⃣ 测试训练结果：挑选出效果最佳的LoRA文件进行测试。

LoRA训练的底层逻辑

为了解决可能出现的疑惑，本段落将深入解释LoRA训练的底层逻辑。通过深入了解这一过程，您将能更清晰地把握如何训练出一个高质量的LoRA模型。

LoRA训练概述

LoRA模型的训练目标是生成的图片与原训练图像高度相似。这是通过在Diffusion模型上添加额外权重来实现的，这些权重被保存在一个称作LoRA文件的单独文件中。可以将LoRA文件视为Diffusion模型的一种插件，这种插件会根据训练过程不断调整权重，以达到与原始训练图相似的效果。

训练过程详解

添加初始噪声：首先，我们会给训练图像添加一些初始噪声，这一步骤是为了模拟Diffusion过程中的噪声添加和去除过程，提高模型的泛化能力。
打标与去噪：在添加噪声后，Diffusion模型将根据训练图上的标注（例如“1girl”）进行去噪处理。这解释了为何我们需要在训练前为训练图打上标签的重要性。
计算Loss值：去噪后，我们将得到一张新的图片，用于与之前添加噪声的图片进行对比，通过这一比较，计算出两张图片之间的差异性，即Loss值。这个值反映了经过初步训练后的图片与原始训练图之间的差异。根据这个Loss值，AI会调整附加在Diffusion模型上的权重，使得模型去噪后的图片与原始训练图更加接近。
迭代优化：这一过程会不断重复，通过迭代调整权重，LoRA文件的训练效果将逐步提升。这个迭代次数也就是我们在Kohya训练器里设置的最大训练步数。
重复次数和轮次：在训练过程中，每张图都会被训练多次，这一次数称为重复次数（Repeats）。所有图片经过若干重复次数的训练后，完成的总体过程称为一个轮次（Epoch），这个参数也是在Kohya训练器中进行设置的。

通过上述步骤，LoRA模型的训练涉及到精细的权重调整和优化，确保了生成图像与原始训练图之间的高度相似性。希望这一解析能帮助您更好地理解LoRA模型的训练机制。

正式开始LoRA训练：以斯嘉丽为例

在理解了LoRA训练的底层逻辑后，我们现在可以开始实际的训练过程了。本次我们将以众所周知的好莱坞明星斯嘉丽·约翰逊为例，展开训练。下面是详细的步骤和一些建议，希望能帮助你顺利完成LoRA模型的训练。

第一步：准备训练集

成功的LoRA训练起始于高质量的数据集。以下是一些建议，帮助你准备一个合格的训练集：

选择合适的图片作为训练集是至关重要的第一步。优质的数据集直接影响训练结果的质量。

第二步：图片预处理

裁剪

为了让AI更好地学习人物的脸部特征，建议以1比1的宽高比进行裁剪，主要聚焦于头部区域。稍微包含一些肩膀部分也是可以的。这样的裁剪策略有助于生成更加逼真的LoRA图像。这样可以让AI充分学习人物的脸部特征，生成的LoRA也更像。如果到时候我们训练出的LoRA生成的图片只有大头照也没关系，因为我们可以先生成其他人物的全身照，然后用LoRA生成的大头照进行换脸。这几张斯嘉丽的图片我就是这样生成的。灵活度很高，想要什么风格就什么风格。

放大

鉴于许多在线图片的分辨率较低，裁剪后的图片分辨率可能进一步降低。因此，我们推荐将图片放大至至少512×512的分辨率。如果条件允许，可以考虑放大到768×768。图片放大不仅可以提升图片细节，还能丰富训练过程中的学习材料。

推荐工具：可以使用Topaz软件或是WebUI里的StableSR脚本进行图片放大。经比较，Topaz在某些情况下可能提供更好的效果。

放大完以后，我们就可以进行最终裁剪啦。上篇文章(https://myaiforce.com.cn/text-inversion/)中，我给大家推荐了一个非常好用的在线裁剪工具，感兴趣的话可以回顾一下。

第三步：打标

为什么要打标：如前所述，打标是为了在训练过程中指导模型更准确地学习和重建目标特征。通过对图片进行适当的标注，可以帮助模型理解并重现人物的特定特征。
如何打标：详细的打标方法在之前的文章(https://myaiforce.com.cn/text-inversion/)中有所提及。如果你对打标的具体操作还有疑问，可以参考之前的相关介绍或教程，以获得更深入的了解。

通过遵循上述步骤，你将能够为LoRA训练准备好高质量的数据集，并进行有效的预处理。这样的准备工作是成功训练LoRA模型的关键。希望这些指导能帮助你顺利进行训练，并创造出令人印象深刻的人物图像。

LoRA训练核心参数详解

在图片处理完成之后，我们将进入Kohya训练器的设置阶段，这一阶段是LoRA训练过程中至关重要的一步。接下来的指南将帮助您熟悉Kohya训练器的界面和必要的设置选项，确保您的训练顺利进行。

选择预训练模型

预训练模型名称或路径：首先需要指定训练所用的底模，也就是预训练的Diffusion模型。LoRA训练实质上是在这个底模的基础上通过微调权重来实现的。
底模推荐：建议使用SD1.5的第一代模型，根据测试，其性能甚至优于SDXL模型。建议直接填写模型的路径以确保准确无误地加载模型。
其他选项：底模选择好以后，下方会出现三个选项，都不要勾选。

设置训练项目文件夹

1️⃣训练模型输出名称：为训练好的LoRA文件命名。这一步骤对于后续的测试和使用非常重要，确保您能够轻松识别和调用不同的训练结果。

2️⃣图片文件夹路径：需要指定一个包含训练图片的文件夹。这里存放的是您预处理后用于训练的图片，确保路径设置正确。

3️⃣LoRA文件输出路径：指定LoRA训练结果存放的位置。这个文件夹将用于保存训练过程中生成的LoRA文件，方便后续测试和使用。

4️⃣训练日志文件夹路径：设置一个文件夹用于存放训练过程中生成的日志文件。这对于监控训练进度和调试可能出现的问题非常有帮助。

其他设置

正则化图片文件夹：这个选项通常用于训练特定的画风，对于训练人脸或二次元人物不太适用，因此我们在此场景下不需要考虑。

新建训练项目文件夹

填这些路径之前，首先得新建一个训练项目的文件夹。

1️⃣新建项目文件夹：首先，创建一个新的训练项目文件夹，例如命名为scarlett_johansson。重要提示：为了避免潜在的问题，请确保文件名不包含中文字符或空格。

2️⃣创建必要的子文件夹：在项目文件夹内部，需要创建三个子文件夹，分别命名为image、models、和log。这些文件夹分别用于存放训练数据集、输出的LoRA模型文件以及训练日志。

3️⃣添加数据集和打标文件：在image文件夹下，进一步创建一个用于存放具体数据集和打标文件的子文件夹，如25_ScarlettJohansson。这里的25代表对每张图片进行的重复训练次数（Repeats），建议设置在10到30之间。文件夹名称的其余部分应反映训练的概念或主题，例如人物的姓名。

注意事项

路径复制：通过点击文件浏览器上方的地址栏并使用快捷键Ctrl+C来复制所需的文件夹路径，随后粘贴到Kohya训练器的相应配置中。
避免使用具体概念文件夹的路径：在设置数据集路径时，应选择到image这一层级的路径，而不是直接到25_ScarlettJohansson这样的具体概念文件夹。

参数详解

LoRA类型：在训练器中，首先要选择的是LoRA的类型。对于人脸训练，选择“Standard”即可。如果你的目标是二次元人物，那么可能需要考虑其他选项。
训练批次大小：一般设置为1。这意味着一次性处理一张图片，适合大多数显存容量的配置。
最大训练步数：这是整个训练过程中迭代的总步数。设置范围通常在3000到5000步之间，这个参数直接影响训练的深度和质量。
Epoch：代表整个数据集将被重复训练的次数。合理的Epoch范围为5到10，这个范围可以平衡训练深度和防止过拟合的需求。
重复次数：指的是每张图片在每个Epoch内被训练的次数。这个参数可以根据最大训练步数、Epoch和图片数量计算得出。

重复次数计算公式

我们可以使用以下公式来确定重复次数：

例如，如果我们设置最大训练步数为4800，有32张图片，且Epoch设置为10，那么：

这意味着，每张图片在每个Epoch内将被重复训练15次。

然后我们回头把训练集的文件夹重命名一下。

其他参数

每N个epochs保存：这个设置决定了多久保存一次训练好的LoRA文件。如果设置为1，则每完成一轮Epoch后保存一次。这样做的好处是可以提供多个训练阶段的模型，供后续选择使用。
Caption Extension：填写的是打标文件的文件名的后缀，也就是“.txt”，以避免在训练过程中出现“no caption file found”的错误。
精度选项：推荐设置为“fp16”，这有助于节约显存同时加速训练过程。
缓存潜变量：启用此选项可以将所有图片一次性缓存到显存中，从而提高训练速度。

高级LoRA训练参数设置

在LoRA训练的深入阶段，理解和调整高级参数是提升训练效果的关键。这些参数的精细调整可以大大影响训练的效率和产出的质量。下面，我们将详细介绍如何根据不同需求选择和设置这些参数，以及提供两种高效的调参方案。

学习率与优化器

学习率：可以被看作是训练过程中学习的速度或强度。如果把训练LoRA的过程比作烤面包的话。学习率就是你设定的烤箱的温度。温度越高，面包烤的越快。但很容易把面包烤焦。这种情况在机器学习领域也称为过拟合。温度越低，面包烤的越慢。可能很长时间过去了，还是没有烤熟。这种情况称为欠拟合。
学习率调度器：用于在训练过程中动态调整学习率。
优化器：负责根据损失函数更新模型的权重。优化器的选择直接影响训练的稳定性和最终模型的性能。
最大分辨率：如果训练图超过这里指定的分辨率，Kohya会按照这里设定的分辨率进行缩放。因为我的图片裁剪成了768×768。所以这里我改一下。如果你的图片是512的，就不用管它。
启用数据容器：bucket这个单词直译过来就是“水桶”。LoRA 中使用的训练图像不一定要大小相同，但不同大小的图像不能同时进行训练。因此，有必要在训练前根据图像大小将其分类放入 “桶 “中。启用了这个选项以后，Kohya就会把你所有训练图整理一遍，将其中比例相同的图像放进同一个桶里，再智能缩放到相同尺寸上。我建议不要开启这个选项。“桶”的数量越多，训练的质量越差，训练的速度也越慢。最好是一开始就把训练图裁剪成统一的尺寸。
网络秩：该参数调节的就是附加权重里的神经网络隐藏层的神经元的数目。神经元数目越多，可存储的学习信息也就越多。也就是说，这个参数调的越大，训练出来的脸部细节也越丰富。当然，这个参数也不必调得过大。否则训练出的人物也会不那么像，LoRA文件也会变得过大。我通常设置为128，适用于大多数人脸训练任务，确保足够的模型复杂度以捕捉细节。如果是训练二次元人物，可以设置的低一些，比如64。
网络Alpha：设置为“网络秩”的一半或者更小。

高级功能

交叉注意力（Cross Attention）：确保开启XFormers，这可以显著降低显存占用并加速训练过程。

调参方案

方案一：静态学习率

学习率：包含“文本编码器学习率”和“Unet学习率”，推荐使用Kohya官方文档的推荐设置。
优化器：AdamW8bit，这是一个经过时间检验的优化器，以其稳定性著称。
学习率调度器：选择带重启的余弦函数，这个调度器会让学习率在更多的点上达到峰值，随后平滑衰减，这样可以更充分地学习数据集。
学习率周期数：建议设置在3到5之间，以平衡学习的效率和避免过早陷入局部最优解。

方案二：动态学习率

优化器：DAdaptAdam或Adafactor。“DAdaptAdam”对显存是有要求的。最小要求6GB的显存。如果你显存不足的话，可以尝试“Adafactor”这个优化器。
优化器额外参数：如果设置为“DAdaptAdam”，则在下方的额外参数添加--optimizer_args "decouple=True" "weight_decay=0.01" "betas=0.9,0.999"。如果优化器设为“Adafactor”，则在下方的额外参数添加--optimizer_args "relative_step=True" "scale_parameter=True" "warmup_init=True"。
自适应学习率：这两个优化器都是一种自适应的优化方式，可以自动修正学习率，对于过拟合有很好的限制作用，可以将所有相关的学习率设置为1。

查看训练进程

成功配置参数并启动训练后，LoRA模型的训练进程正式开始。此时，有效监控和理解训练过程变得至关重要。下面是训练过程中的关键步骤和要点，帮助你确保训练顺利进行并有效地保存模型。

训练启动与监控

1️⃣启动训练：在Kohya训练器中设置好所有参数后，点击“开始训练”按钮以启动训练过程。

2️⃣检查训练状态：训练开始后，需要转到命令行窗口或终端查看训练的实时状态。这个终端窗口是启动Kohya训练器时打开的，不同操作系统或环境（如本地或服务器）的界面可能略有不同。

关键指标解读

1️⃣显示参数：终端会显示出当前训练使用的所有参数设置，这可以帮助你确认是否所有配置都按预期进行。

2️⃣总训练步数：系统会基于你的设置计算并显示总的训练步数，这是衡量训练深度的一个重要指标。

3️⃣进度条与轮次：展示当前训练的进度和所处的轮次（Epoch）。如果设置了多轮训练，可以看到当前正在进行的是哪一轮。

4️⃣预估时间：训练旁边可能会有一个预估的完成时间，帮助你规划训练过程。

5️⃣Loss值：训练过程中最关注的数值之一是Loss值，它反映了模型输出与目标之间的差异。随着训练的进行，理想情况下Loss值应逐渐降低。

训练完成与模型保存

当看到命令行中出现“model saved”信息时，意味着LoRA模型已经成功保存。根据你的设置，“每N个Epochs保存”，你将在指定的文件夹中找到相应数量的LoRA模型文件。

检查输出文件

训练完成后，进入之前设定的模型输出文件夹。在这里，你应该能看到所有生成的LoRA文件。如果设置的Epoch为10，则预期会有10个模型文件，每个文件代表训练过程中的一个保存点。

评估LoRA训练效果

在完成LoRA模型的训练后，评估其训练效果成为了下一个重要的步骤。如何判断哪个LoRA模型的效果最佳呢？以下是一套实用的流程，帮助你通过直观的图像生成测试来评估每个模型的性能。

准备LoRA文件

1️⃣重命名LoRA文件：为了便于管理和测试，建议将最后一个生成的LoRA文件重命名，比如将其命名为“第10号文件”，这样便于后续的对比分析。

2️⃣文件迁移：将所有LoRA文件拷贝到WebUI平台上常用的LoRA文件夹中。这一步骤确保了在进行图像生成测试时，所有训练好的模型都可以被轻松调用。

在WebUI上进行测试

1️⃣设置提示词：在WebUI界面上，输入用于图像生成的提示词，并调整好基本的生成参数。这些参数包括但不限于图像的尺寸、生成质量等。

2️⃣选择LoRA文件：作为测试的一部分，先选中你刚刚训练并迁移的某个LoRA文件，比如“1号LoRA”。

3️⃣使用XYZ图表进行对比测试：

在最下方的脚本里选择XYZ图表。

在“X轴类型”中选择“提示词搜索替换”，并在“X轴值”中填入不同的LoRA文件编号，这样能够按顺序生成由这些LoRA文件产生的图像。
“Y轴类型”同样选择“提示词搜索替换”，而在“Y轴值”中则填入一系列LoRA权重值。这允许你在不同权重下观察单个LoRA文件的表现。

4️⃣生成并比较图像：设置完成后，向上滚动页面并点击“生成”按钮。随后，系统将根据设置生成一个包含各个LoRA文件及其在不同权重下表现的图表。

分析结果

横向比较：通过观察图表，你可以横向比较不同LoRA文件生成的图像，判断哪个LoRA文件更准确地捕捉到了人物的特征，哪个的图像质量最高。
纵向分析：纵向分析则允许你评估单个LoRA文件在不同权重设置下的表现，从而找到最优的权重值。

结语

通过本文，您应该对如何训练一个高质量的真人LoRA模型有了全面的了解，从准备数据集到参数设置，再到最终的测试。随着技术的不断进步，LoRA训练变得越来越简单，希望您能够利用这些知识创造出令人惊叹的人物图像。如果本文对您有所帮助，请不吝点赞和分享，感谢您的支持！

SD WebUI

这个 Stable Diffusion 新模型换脸效果真不错！

ByVito 2024年2月3日2024年2月3日

ControlNet 是 Stable Diffusion Web UI 中功能最强大的插件。基于 ControlNet 的各种控制类型让 Stable Diffusion 成为 AI 绘图工具中最可控的一种。 IP Adapter 就是其中的一种非常有用的控制类型。它不仅能够实现像 Midjourney 一样的“垫图”功能，还能用来给肖像人物换脸。 IP Adapter 的很多老的模型都可以用来换脸，如 Plus Face。然而，IP Adapter 不断推出了更新的模型，持续为我们带来惊喜。通过我的亲身测试，我发现新的 Face ID Plus V2 模型在换脸效果上远胜以往。我尝试将好莱坞女星 Angelina Jolie 的脸部特征融合到了由 Midjourney 生成的多个图片中，包括一名中世纪女战士、一幅文艺复兴时期的美女肖像，以及一位女王的形象，效果都非常令人满意。怎么样？效果还不错吧？接下来我来介绍如何在 Web UI 中安装并使用这个模型。如果你喜欢看视频教程，那么我非常欢迎你观看本文所对应的视频(B站同名帐号)：准备工作我们主要利用 Control Net 中的 IP Adapter 来进行换脸，同时使用 OpenPose 保持原图人物的头部姿势。相对于 Control Net…

SD WebUI

Stable Diffusion 改变光线的能力简直太强大了！

ByVito 2024年1月4日2024年1月4日

在没有 Stable Diffusion 的年代，对照片的光线进行后期处理，基本上要依靠 Photoshop。比如添加一个曝光图层。这个技术对于形状简单的物体来说很方便，因为光线效果很好模拟。但对于形状复杂的主体，比如人来说，要想实现自然的光线效果，你最好得有美术功底，并配备一个数位板。 Stable Diffusion 的出现使得改变光线变得既简单又自然，因为它学习过无数的照片里的光线，从而可以模拟出非常真实的光线效果。本文将通过实际案例，为你一步步揭晓这一神奇的功能，让你借助 AI 的力量轻松驾驭图片里的光线。任务简介下面这张图也是 Stable Diffusion 生成的。当然，我们也可以处理相机拍出来的照片。图中的光线是从主体左边照过来的。现在我们要换一个方向，变成右边照过来。如果在 Photoshop 的曝光图层上通过画笔涂抹的话，没有美术功底的人很难实现非常自然的效果。让我们看看怎样通过 Stable Diffusion 来处理。用到的模型我们将要借助 Stable Diffusion 的 ControlNet Brightness 模型。这个模型可以在 HuggingFace 上下载，地址是 huggingface.co/ioclab/ioc-controlnet/tree/main/models。如果你跟我一样用这个SD云平台的话，它已经被内置在 WebUI 里啦，简直太方便！ 👉 玩 Stable Diffusion 没有好显卡？试试秋叶大佬推荐的云平台这个模型，顾名思义，就是用来控制图像明暗。我们只需要选择它，并上传一张记载图像明暗信息的灰度图。为了改变原图的明暗，我们可以在 Photoshop 中修改它的灰度图。 PS预处理在 Photoshop 中将图片转换为灰度模式后，我们就可以使用减淡/加深工具来调整明暗。在需要提亮的地方，我们使用减淡工具进行涂抹；在需要调暗的地方，我们则使用加深工具进行涂抹。这些涂抹不需要很精细，因为稍后 Stable Diffusion 会把明暗关系处理得更自然。下图是我涂抹的灰度图。我把主体头顶上方的区域由亮变暗。并把主体的右侧身体提亮，左侧身体变暗。图片左上角也增加了明亮区域。 SD处理光线…

SD WebUI

比 Roop 和 Reactor 更像！IP Adapter 新模型为任何人做写真

ByVito 2024年2月9日2024年3月1日

继我们上一篇文章介绍了IP-Adapter的新模型Face ID Plus V2之后，今天我们将深入探讨如何将这一强大工具用于生成具有高度个性化特征的人物肖像，保持脸部一致性的同时，创造出各种不同风格的形象。这个模型也可以在 Stable Diffusion 的云平台上使用。 👉 玩 Stable Diffusion 没有好显卡？试试秋叶大佬推荐的云平台如果你喜欢看视频教程，那么我非常欢迎你观看本文所对应的视频(B站同名帐号)： IP-Adapter应用广泛在上一篇文章中，我们使用了 WebUI 图生图中的局部重绘功能，通过这个功能，我们成功地将好莱坞女神Angelina Jolie的脸融合到了Midjourney生成的图片上。其实，这个新模型也可以在 WebUI 文生图中发挥作用。我们可以用它来生成各种风格不同的人物肖像，并且保持脸部的一致性。比如说，我用同一张 Angelina 的头像作为参考图给到 IP Adapter。通过修改不同的提示词，就能生成 Angelina 的各种风格的照片。我试了另一个换脸插件 Reactor。它的效果和 Roop 差不多，我感觉都比不上 IP Adapter 的这个模型。这是用 Reactor 生成的几张 Angelina 的照片。我感觉和 Angelina 本人并不像。我还试了近期比较热门的另一个用来换脸的 ControlNet。就是小红书开发的 InstantID。这是用 InstantID 生成的照片。虽然和 Angelina 本人比较像，但图像质量比较差，脸部缺乏细节，而且高光和阴影都太强烈。通过对比这几个工具的效果，我还是更偏爱 IP-Adapter的这个新模型。本文将介绍它配合…

SD WebUI

用 Stable Diffusion 10分钟实现电商模特换装/换模特

ByVito 2023年12月27日2023年12月27日

Stable Diffusion 以其可控性被越来越多的设计师纳入了工作流程。以电商为例，在AI工具出现以前，拍摄服装的成本很高昂。聘请专业的模特都是按小时计费的。聘请外模的话价格就更高了。如今，服装可以穿在任何人身上，甚至塑料模特身上。借助 Stable Diffusion，就可以把塑料模特替换为真人模特。于是，拍摄服装的成本大大降低。和传统PS抠图相比，Stable Diffusion的效果更加自然。并且这套流程还可以应用在产品上面。对于电商来说是革命性的。接下来，让我们通过实际案例来了解实现过程。我们的目标是替换掉下面的模特。其实，这个模特甚至可以是塑料模特。这样，在拍摄服装时，我们只需要找到一个塑料模特，然后穿上我们想要展示的服装即可。安装插件首先我们要为 Stable Diffusion 安装一个叫 ”Inpaint Anything“ 的插件。它可以利用最先进的图像识别算法，为你制作蒙版。这个做蒙版的过程比在 PS 里更加方便快捷。当然，有些用户也许不必安装。比如我在使用的一个云平台，内置 Inpaint Anything 插件。 👉 玩 Stable Diffusion 没有好显卡？试试秋叶大佬推荐的云平台总的来说，安装这个插件有两种方式。 1️⃣ 通过 WebUI 安装，这种方法适用于本机魔法环境。把 https://github.com/geekyutao/Inpaint-Anything.git 这个网址复制到 WebUI，并点击安装。接着点击 ”已安装“ 标签页，然后点击 ”应用并重启用户界面“。重启 WebUI 之后，就可以看见 Inpaint Anything 出现在 WebUI 的标签页了。 2️⃣ 本地上传。前往 https://github.com/geekyutao/Inpaint-Anything/releases 这个网址，然后根据自己的系统选择一个压缩包，下载并解压至 WebUI 的 Extension…

SD WebUI

玩 Stable Diffusion 没有好显卡？试试秋叶大佬推荐的云平台揽睿星舟

ByVito 2023年12月26日2023年12月26日

很多喜欢AI绘画的朋友一听说 Stable Diffusion 就望而却步了。总觉得要买个大几万的好显卡才能跑的起来。其实现在云端那么发达，上面的显卡应有尽有。硬件不应该成为我们 AI 道路上的绊脚石。云平台甚至比本机部署还要方便。拿我最近一直在使用的这个云平台举例。它支持一键部署 Stable Diffusion，自带200多个模型和各种常用插件。几乎就是直接上手。安装过程中遇到任何问题还可以找客服解决。我已经连续使用了一个礼拜，几乎每天都在用。它也得到了秋叶大佬的多次种草。平台上甚至还有秋叶亲自制作的炼丹炉。它的性价比也很高，经常有各种优惠活动。3090的显卡从晚上12点到次日早上9点更是低至1.5元/时。我总结了自己使用它的理由：注册为了演示注册过程，我新注册了一个账号。 1️⃣ 打开网址：https://www.lanrui-ai.com/register?invitation_code=1297820264 2️⃣ 打开网址以后就自动填入了我的邀请码1297820264。有了这个邀请码，就可以获赠新人的白嫖券。接着完成注册。开始免费体验 1️⃣ 点击屏幕右上角用户名，然后在下拉窗口中点击充值按钮。 2️⃣ 选择其它金额，输入3.8，就可以看见一个新人专享体验券。接着选择体验券，然后点击充值并零元支付。创建工作空间 1️⃣ 点击顶部导航栏的”去市场“按钮，进入选择一台机器。 2️⃣ 根据需要选择一个 GPU，并点击购买。根据是否有活动和使用的时间段，这个价格也会波动。 3️⃣ 再选择一个镜像。推荐”SD1.6+SDXL全插件版“。因为它继承了多个最新且实用的插件。网盘选择挂载。网盘提供无限大的存储空间，每个用户拥有10GB免费空间，超过部分会按照实际使用量计费（0.15元/GB/月）。数据集选择”sd-base“。预训练模型根据自己的需要，如果想体验SDXL，可以选择”sdxl-models“。否则，选择”sd-webui-model“。最后，点击右下角的”创建“按钮。之后稍等几分钟，待状态变为”运行中“以后，工作空间的实例就创建好了。然后点击右侧的”进入“按钮，并选择 ”JupyterLab“。启动WebUI 1️⃣ JupyterLab 类似于 Windows 电脑上的文件浏览器。里面可以浏览各种模型，插件。进入 JupyterLab 以后，点击”Terminal“进入终端。 2️⃣ 进入终端会弹出说明。根据说明，平时输入命令 bash /app/start.sh 即可启动 WebUI。首次启动因为没有安装额外的插件，所以可以输入bash /app/start.sh –skip-prepare-environment 这个命令跳过环境准备，更快地启动 WebUI。 3️⃣ 当页面显示“http://0.0.0.0:27777”，说明已启动成功。…

SD WebUI

白底图换场景图 (Stable Diffusion + Photoshop Beta)

ByVito 2023年12月30日2023年12月30日

Stable Diffusion 因其出色的可控性，越来越受到专业人士的青睐，成为 AI 绘图工具中的佼佼者。以电商领域为例，它带来的影响不仅仅是提升了效率，更重要的是降低了成本。以前，要拍摄一组高质量的场景图，通常需要求助专业的摄影工作室。而摄影工作室为了打造一个合适的场景，可能需要在装修上投入大量的成本。现在，Stable Diffusion 可以轻松生成各种类型的场景图，使得整个流程都可以在电脑上完成。我们甚至只需要拍摄一张简单的白底图就可以了。本文将通过一个实际案例来演示这个工作流程。借助 Stable Diffusion 和 PS Beta ，我们将为下图所示的香水白底图添加一个场景。很多人没有入门 Stable Diffusion 的原因是没有好的显卡。但现在的云端技术很发达，完全可以在云端跑 Stable Diffusion。还没有使用过的朋友可以看看我的这篇介绍： 👉 玩 Stable Diffusion 没有好显卡？试试秋叶大佬推荐的云平台 1. 在 SD 中生成场景图我选择的是基于 SDXL 的模型 DreamShaperXL Turbo 模型。它不仅出图速度快，而且画质也很好。我甚至反向提示词 (Negative prompt) 都不用写。它只需要 7 步就能生图，采样器 (Sampling method) 我选的是 “DPM++ SDE Karras”。为了让原先的香水瓶在场景中的形状和构图保持不变，我把原先的白底图上传到 ControlNet，然后用 Canny 模型生成它的轮廓图。如下图所示，我基本没有调整参数。也可以勾选完美像素 (Pixel Perfect)，对照片的效果更好一些。点了哪个形状像爆炸一样的按钮，Stable Diffusion…

Kohya训练器

LoRA训练流程

LoRA训练的底层逻辑

LoRA训练概述

训练过程详解

正式开始LoRA训练：以斯嘉丽为例

第一步：准备训练集

第二步：图片预处理

裁剪

放大

第三步：打标

LoRA训练核心参数详解

选择预训练模型

设置训练项目文件夹

其他设置

新建训练项目文件夹

注意事项

参数详解

重复次数计算公式

其他参数

高级LoRA训练参数设置

学习率与优化器

高级功能

调参方案

方案一：静态学习率

方案二：动态学习率

查看训练进程

训练启动与监控

关键指标解读

训练完成与模型保存

检查输出文件

评估LoRA训练效果

准备LoRA文件

在WebUI上进行测试

分析结果

结语

Similar Posts

Leave a Reply Cancel reply