Midjourney危险了：来看 FLUX如何超越它

ByVito 2024年8月16日2025年1月21日

AI绘画领域发展迅猛，近来黑森林实验室推出的 FLUX 引发了创作者的高度关注。FLUX 乃是一套开源的文本到图像模型，据官方评估，其性能优于该领域众多领先模型，包括开源模型与闭源模型，其中广为人知的 Midjourney 也在其列。

作为曾对 Midjourney 功能展开广泛探索并予以记录之人，我对有关 FLUX 超越 Midjournbey 的说法饶有兴致。秉持着审慎的怀疑态度，我决定对 FLUX 加以测试，将其与 Midjourney 于几个关键方面进行直接比对。此文详尽阐述了我的研究成果，对这两款强大的AI绘画模型展开了全面比较。

欢迎观看本文的视频教程：

Table of Contents

文本生成

首先，咱们来瞧瞧 FLUX 和 Midjourney 的文本生成功能。为凸显两者之差异，请看如下两组图片：左边为 FLUX Dev 生成的图片，右边则是 Midjourney V6.1 生成的图片。

1. 文本生成和质感

两个模型对于简单的单词拼写处理皆较为娴熟。然而，在纹理细节方面，FLUX 似乎更具优势。譬如，Midjourney 生成的单词“HEAL ”呈现出类似饼干的质感，这与预期的水果外观并不相符。相较而言，FLUX 所提供的纹理更为恰当，使文字看上去更为逼真，也更契合提示词的要求。

上面这组冰块的示例，质感上的差别就更为显著了。FLUX 生成的文本因其清晰度而引人注目——“Cubes”（冰块）一词周边轮廓清晰，极具视觉吸引力，而 Midjourney 的版本则缺乏这种精准度。

2. 宽高比灵活性

FLUX 的另一显著长处在于支持各类长宽比，此功能较 Midjourney 增添了更大的灵活性。例如，在宽高比为 1:1 的情形下，FLUX 生成的文字更小，间距也更小，确保从正面观之，五个字母皆清晰可辨。然而，Midjourney 在这一方面却难以做到——其字母显得颇为拥挤，且无法从正视角度清晰呈现。

结论

总体而言，FLUX 展现出卓越的文字生成和排版能力，在这一方面甚至超越了 Midjourney。FLUX 能够应对不同的长宽比，并生成高品质、纹理清晰的文字。

生成人体

接下来，咱们探讨一下 FLUX 和 Midjourney 如何处理生成人体这一复杂任务——长期以来，这一难题一直困扰着AI绘画模型。

1. 结构精确度

FLUX 的重大改进之一在于其能够生成人形，且不会出现早期模型（如 Stable Diffusion 3）中常见的明显错误。在 FLUX 生成的图像中，人体的描绘精度颇高，不存在重大的解剖学差错。不过，AI的痕迹在某些方面仍较为明显，比如过于凸显的肌肉。这些隆起的肌肉看上去稍显不真实，熟悉肌肉结构之人很容易便能辨别出此乃人工智能生成的图像。

而 Midjourney 塑造的肌肉结构则显得相对真实一些，尤其是在增添汗水等细节时。这使得 Midjourney 图像中的健美运动员看起来更为生动，有助于提升整体的逼真程度。

2. 空间关系

虽说 Midjourney 在肌肉逼真度方面或许占据优势，但在空间关系方面却存在较大问题。例如，在一张图片中，杠铃似乎穿过了女子的头部——这是一个明显的缺陷，打破了生成场景的沉浸感。相比之下，FLUX 在这方面表现出色。由于 FLUX 支持灵活的长宽比，它能够准确地描绘空间关系，使整个杠铃皆能得以展现，而不会挤占图像或导致令人尴尬的错误。

3. 动作和姿势：芭蕾舞和瑜伽

在比较这两个模型处理动态姿势（如芭蕾舞演员和瑜伽练习者的姿势）的表现时，FLUX 和 Midjourney 皆令人称赞，但也存在一些差异。

芭蕾舞演员：两个模型生成的芭蕾舞演员图像颇为相似，只是各自存在一些细微问题。不过，Midjourney 的版本尽管瑕疵稍多，但的确更具戏剧美感，尤其是在光线和阴影的运用方面。
瑜伽姿势： 在瑜伽姿势方面，FLUX 展现出非凡的精准度，近乎完美地呈现了复杂的姿势。Midjourney 的表现同样出色。

结论

在生成人体方面，FLUX 和 Midjourney 难分伯仲。FLUX 在空间关系和动态姿势的准确描绘方面表现出众，而 Midjourney 则在呈现逼真的肌肉结构和戏剧性的灯光方面略占上风。总体而言，这两个模型皆展现出显著优势，使其成为在AI艺术中生成人物形象的有力工具。

互动/提示词遵循

接下来，让我们深入探究一下“互动”这一概念——即这些模型描绘人与物体之间自然交互的能力，或者说它们如何精准地遵循所给定的提示词。

1. 处理复杂角度和互动

设想一个小男孩正侧着头看肩膀的场景——这是任何模型都难以精准捕捉的角度。在此情形下，FLUX 的表现优于 Midjourney。虽说 FLUX 图像中的蝴蝶并未如提示词所暗示的那般准确落在小男孩的肩膀上，但它确实落在了小男孩的手臂上，与 Midjourney 生成的图像相比，FLUX 营造出了更为自然和可信的互动效果。FLUX 还善于捕捉小男孩的目光，完美地传递出一种惊奇的感觉。

2. 提示词的遵循和表达

在另一组图片中，Midjourney 对提示词的依从性更强，几乎完全依照了提示词。相较而言，FLUX 则稍显逊色。例如，在一个男人应表现出惊讶的场景中，FLUX 图像中男人的表情缺乏提示词所期望的强烈或清晰的情感。在此，Midjourney 对细节的关注，尤其是面部表情方面，使得画面更具说服力，也更贴合提示词的要求。

3. 图像质量和真实感

谈及整体图像质量，Midjourney 通常能生成更为逼真的效果，特别是在皮肤纹理和细节方面。Midjourney 图像中的皮肤往往看上去更自然，微妙的细节增强了真实感。另一方面，FLUX 有时生成的皮肤看起来有些像塑料，影响了图像的整体真实感。

结论

尽管 FLUX 存在一些缺陷，但在某些情形下，特别是在创建自然的互动方面，FLUX 仍能超越 Midjourney。虽然在特定状况下，Midjourney 可能在图像质量和对提示词的遵从方面占优，但 FLUX 处理具有挑战性的提示词和细微互动的能力令人印象深刻。这使 FLUX 成为捕捉互动的场景中的一个令人信服的选择，尽管它并非在所有方面都独占鳌头。

手

让我们探讨一下AI绘画中最为棘手的挑战之一：生成逼真的手。众多AI绘画模型在这方面都困难重重，常常生成看起来扭曲或不自然的手。让我们瞧瞧 FLUX 和 Midjourney 在这方面的表现怎样。

1. 手部生成的逼真度

FLUX 的突出之处在于能够生成令人印象深刻的逼真手形。尤其在处理具有挑战性的角度时，例如左手以非同寻常的角度放置，FLUX 能够保持解剖的准确性和自然的外观。这种细节水平对于创建令人信服的图像极为重要。

另一方面，Midjourney 在手部生成方面存在一些明显的问题。即便在一些较好的例子中，Midjourney 也难以处理指甲盖等细节，特别是无名指和小指。这些不准确的地方会分散注意力，降低图像的整体真实感。

2. 不同场景的一致性

Midjourney 的手部生成问题并非偶然出现，而是一个持续性的问题。例如，在一组描绘某人弹钢琴的图像中——在此情况下，手的准确性至关重要——Midjourney 再次出现问题。它生成的手常常显得笨拙或不正确，破坏了场景的视觉完整性。相比之下，FLUX 能更精准地处理此项任务，生成的手在图像背景中看起来恰当而自然。

结论

在生成手部图像方面，FLUX 明显优于 Midjourney。无论是非正常角度下的解剖精确度，还是不同场景下的一致性，FLUX 都展现出卓越的能力。

人脸生成

生成逼真的人脸是对AI绘画模型的又一关键考验，而在这一领域，皮肤纹理和色调等细微的细节起着决定性作用。让我们看看 FLUX 和 Midjourney 在这方面的表现如何。

1. 皮肤纹理和逼真度

在皮肤纹理方面，Midjourney 的优势极为显著。其生成的人脸看上去更为逼真，皮肤纹理栩栩如生。Midjourney 能够依据提示词反映出暖色调，从而营造出更自然、更令人信服的外观，进一步增强了这种真实感。

相比之下，FLUX 在这方面颇为吃力。FLUX 生成的脸部皮肤经常出现油腻或塑料感，影响了图像的整体真实感。与 Midjourney 甚至 Stable Diffusion 3 Medium 相比，这一问题尤为突出。值得注意的是，在皮肤纹理质量方面，Stable Diffusion 3 Medium 有时能够超越 FLUX 和 Midjourney，生成的人脸纹理更加细腻自然。

2. 处理眼泪和情感细节

虽然 FLUX 在皮肤纹理方面有所欠缺，但在面部细节的某些方面，比如眼泪的生成方面，它的确能够赶上 Midjourney。FLUX 和 Midjourney 都能在提示词出现时显示眼泪——这可不是所有模型都能够做到的。

例如，在与 Juggernaut XL 和 Stable Diffusion 3 Medium 的比较中，这两个模型都未能成功捕捉到眼泪，这表明 FLUX 和 Midjourney 在这一方面表现出色。

结论

在脸部生成方面，Midjourney 优于 FLUX 的主要原因在于其出色的皮肤纹理。FLUX 虽然能够处理某些面部细节，如眼泪，但在生成逼真自然的脸部表情方面始终处于下风。

最后的想法

在仔细研究了这些图像之后，FLUX 作为一个开源模型，显然在AI绘画方面取得了显著的进步。它在多个方面超越了 Midjourney，例如提示词遵循和手部生成，展示了开源模型的巨大潜力。

虽然 FLUX 目前在整体图像质量方面还存在不足，但它的开源特性允许其与其他模型合作，从而有可能迅速提升图像质量。

围绕 FLUX 的热度表明，在不久的将来，我们有望看到基于这项技术的更加完善的模型。我将持续为您更新有关 FLUX 的教程，如果您还没有关注我，现在正是关注的好时机！

ComfyUI

Flux官方最新王炸模型，7合1工作流 (ControlNet+局部重绘+扩图+风格迁移)

ByVito 2024年11月23日2025年1月21日

黑森林实验室（Black Forest Lab），作为革命性 Flux 模型的创造者，最近推出了一套强大的新工具，旨在重新定义我们在 ComfyUI 中处理图像生成和编辑的方式。这些尖端模型——Fill, Canny, Depth 和 Redux——带来了诸如局部重绘（inpainting）和扩图（outpainting）、精确边缘检测 (Canny)、深度映射 (Depth) (Depth)以及创意风格迁移等高级功能。然而，真正让 Flux 工具脱颖而出的是它的性能。在一对一的基准测试中，Flux 模型始终优于类似的专有解决方案，如 Midjourney ReTexture 和 Ideogram V2。例如，Flux.1 Fill [pro] 模型目前被认为是最先进的局部重绘模型，在质量和效率上都无出其右。同时，Flux.1 Depth [pro] 模型在深度感知任务的多样性和可靠性上超越了 Midjourney ReTexture。本文将深入解析这些模型的独特功能，并为您提供一个高效的工作流，帮助您快速上手。功能与工具概述全新 Flux 模型套件——Fill, Canny, Depth 和 Redux 提供了顶级的性能和多功能性。以下是每个模型的功能以及它们如何超越竞争对手的简要介绍。 1. Fill 模型：局部重绘与扩图的强大引擎 Fill 模型为局部重绘与扩图设立了新的标杆，呈现出卓越的细节和无缝的过渡效果。 2. 结构化控制：Canny 和 Depth 结构化控制（Structural Conditioning）在图像变换工作流中是一项强大的功能，它通过 Canny 边缘检测或深度映射…

ComfyUI

万能换背景工作流 V4 更新，产品人像通用，改变光效保留细节

ByVito 2025年1月8日2025年1月21日

在本文中，我将介绍我对 ComfyUI 换背景工作流的最新改进。过去几个月，我发布了多个更新，比如用了 IC-Light 和基于 Flux 的 ControlNet 提升效果。但最近，我开发了一个更快速、更强大的版本。概述与新功能在之前的 ComfyUI 版本中，IC-Light 和基于 Flux 的 ControlNet 可以帮助主体融入新背景。虽然效果不错，但这些方法速度慢且资源消耗大。更新后的工作流提高了效率与真实感，实现了更快的处理速度和更自然的结果。主要改进：工作流示例 1：人像换背景让我们从人像换背景开始。这是上传的图片。首先，我使用这个工作流移除背景，并将主体重新定位到我们定义的新画布上。轮胎和脚撑的某些部分被移除，因为它们将被沙地填充，新的背景设置在沙漠中。接下来，通过使用 10 个采样步骤的 SDXL checkpoint的精简版本，我们可以改变主体光影并将其与新背景融合。在这个过程中，大部分主体细节得以保留，而这只需约 6GB 的显存。剩下的三个节点组使用基于 Flux 的checkpoint量化版本以及相同的 SDXL 进一步增强结果。工作流示例 2：产品摄影换背景现在，我们来看另一个例子：产品摄影，具体来说是替换 Dr Pepper 软饮料罐的背景。目标是将产品融入新的环境，同时保留细节。这是用于换背景的上传图片。我移除了背景和罐子的一些部分，因为希望这些部分在新背景中看起来被埋在冰中。我将产品重新定位为平放状态，然后仅使用 SDXL 模型的精简版本生成新的背景。最后，使用 Flux 模型获得了更佳的结果。工作流下载与模型安装模型：基础版工作流…

ComfyUI

ComfyUI背景融合工作流，人像产品都适用，SDXL 5步出图

ByVito 2025年1月20日2025年1月21日

在上一篇文章中，我发布了一个 ComfyUI 的换背景的工作流，能够将产品或人像完美地融入新的背景。它的背景是由AI生成的，不过有些情况下我们已经有了一个现成的背景，这时候可以用我今天给大家介绍的这个工作流。实际应用假设你有一张人像，你希望将主体置于一个全新的背景中。第一步是移除现有的背景。这种工作流足够灵活，可以移除简单或复杂的背景。一旦背景被移除，主体会被重新定位到新场景中。真正的“魔法”发生在我们使用Lightning版本的SDXL模型的时候。该模型能够重新调整主体的光影效果，确保光线方向、高光和阴影与新环境相匹配。例如，如果原始光线来自右侧，但新场景的光线来自左侧，SDXL模型会相应地调整主体的光影，从而使主体看起来更自然，与新背景的阴影和高光无缝融合。不仅限于人物，这种工作流在处理产品时同样出色。不论是将一个人物放置在沙滩上，还是将一个产品置于摄影棚环境中，其应用场景几乎是无穷的。通过这一流程，你可以获得令人惊艳的效果，提升项目的视觉吸引力。 ⚡️发电下载工作流：https://afdian.com/p/a31569c0d71d11efac785254001e7c00 节点组1：加载模型现在，让我们一步步学习如何使用这一工作流。在第一个节点组中，我们的主要任务是加载必要的模型并为图像处理做好准备。这一步非常重要，因为它为整个工作流奠定了基础。以下是具体步骤：节点组2：移除背景在第二个节点组中，我们的目标是有效移除主体图像的背景。这一步对于隔离主体并为其融入新背景做好准备至关重要。以下是具体步骤：节点组3：主体重新定位、提示词生成和Canny边缘图像创建在这个节点组中，我们的重点是将主体定位到新背景中，并优化图像的整体外观。以下是具体步骤：节点组4：重绘和阴影调整在这个节点组中，我们专注于通过重绘来优化图像，增强光影效果，确保主体能够自然地融入背景。以下是具体步骤：通过以上步骤，主体可以自然地融入新背景，光影效果也能得到极大的优化。节点组5：创建和修改阴影遮罩在这个最终的节点组中，我们重点是生成和优化阴影遮罩，以提升整体图像质量。以下是具体步骤的详细说明：节点组6：恢复细节与调整阴影在这一部分，我们旨在恢复重绘过程中丢失的细节，并解决阴影融合问题。以下是步骤的详细指南：故障排除与优化技巧在处理复杂工作流时，遇到问题是很正常的。以下是一些帮助你排查问题并优化结果的提示：通过这些步骤和技巧，你可以显著改善图像的阴影质量和整体表现。总结这一工作流赋予你增强图像的能力，通过高效管理阴影和背景，实现真实且视觉吸引力更强的效果。通过遵循上述步骤和提示，你可以获得令人满意的成果。记住，掌握这一工作流的关键在于不断尝试。大胆探索新想法，挑战创造力的边界。每一次尝试都能让你更接近发现创新技术和效果的目标。

ComfyUI

Midjourney + ComfyUI = 完美产品摄影

ByVito 2024年8月10日2025年1月21日

Midjourney可以生成非常惊艳的产品摄影图片，但如果我们想要生成基于自己产品的场景图，就需要进行一些额外的处理。今天，我将分享如何通过Midjourney和我开发的ComfyUI工作流来生成更加贴合自己产品的场景图。 Midjourney+我的ComfyUI工作流我们都知道Midjourney可以生成非常惊艳的产品摄影图片。比如，这张美容产品的图片就是Midjourney生成的。它的光线效果确实很棒。但我们要的是基于自己产品的场景图，比如说，这是我们的产品，一款眼霜。我们可以通过Midjouney的图像参考功能，尽可能地让图片里的产品接近我们的产品。虽然完全再现我们产品的细节并不可能，但我还是通过Midjourney和我开发的ComfyUI工作流做出了这张图。 Midjourney为我生成了产品的场景，我的ComfyUI工作流帮我把产品完美地融入了场景。它改变了产品的光影，但保留了所有产品上的细节，包括文字。感谢大家的建议，我的工作流已经更新到第二版。如果大家想深入了解这个工作流的运行逻辑，可以看看我第一版工作流的视频介绍： 🔗 下载此工作流(国外): https://openart.ai/workflows/myaiforce/GL2vEhda2lKbX0snXCNG 🔗 下载此工作流(国内): https://www.liblib.art/modelinfo/fdc1738d174f4cae8c203818b5b78565 本文将首先和大家分享如何用Midjourney生成产品的背景。然后，简单介绍下第二版工作流的所有更新。如果你喜欢看视频教程，那么我非常欢迎你观看本文所对应的视频(B站同名帐号)：如何用Midjourney生成产品背景在创建产品摄影图时，一个好的背景能够有效地突出产品并提升其质感。我们可以通过Midjourney或Stable Diffusion生成符合自己需求的产品背景图。以下是具体步骤和提示词公式的介绍。 1. 提示词公式：创建多样化的展台要生成多种类型的展台背景，可以使用以下提示词公式。你只需替换公式中的“材料”、“质地/图案”、“形状/结构”和其他括号里的内容，就能生成适合不同产品的展台。 2. 示例1：现代简约的科技产品背景 3. 示例2：乡村风格的有机护肤品背景 4. 不使用展台的背景生成如果你不希望在背景中包含展台，也可以直接使用以下提示词公式生成背景：或者，你也可以将你的产品图上传到Midjourney作为参考，直接生成一个与产品相似的图片。然后手动抹掉产品部分，留下背景，这样的图像也可以作为出色的产品背景。例如，我在文中提到的背景图原本包含产品。但我手动抹去了产品，只保留了背景，效果非常不错。 5. 延伸阅读如果你想了解更多关于如何使用Midjourney生成产品摄影图片的技巧，可以参考我之前写的一篇详细文章。 ComfyUI工作流V2版本更新内容在V2版本的ComfyUI工作流中，我根据大家的反馈和建议，进行了多项改进和功能更新。以下是具体的更新内容： 1. 精准抠图：从“Image Remove Bg”到“BiRefNet” 第一个重要更新是将原先用于抠图的“Image Remove Bg”节点替换为精度更高的“BiRefNet”节点。这一更新大幅提升了抠图的精确度，使得产品图与背景的融合更加自然。 2. 更便捷的图像调整：新增浮点滑动条第二个更新是为“ImageBlend”节点增加了三个浮点滑动条，使您在调整产品位置和大小时更加方便。只需拖动滑条即可完成调整，无需再手动输入具体数值。 3. 优化产品边缘：新增“Lama Remover”节点在“生成背景”组中，我新增了“Lama Remover”节点，用于解决产品边缘可能出现的多余像素问题。 4. 自动调整打光效果：新增“AutoAdjust”节点在“打光”组中，新增了“AutoAdjust”节点，它能够自动调整图像的色彩和对比度，以解决打光过程中可能出现的偏色问题。…

ComfyUI

ComfyUI 使用 LoRA 极简工作流

ByVito 2024年4月22日2025年1月21日

ComfyUI的LoRA工作流相信大家都不陌生。开发者提供了大量基于默认节点功能搭建的工作流，其中就包括了如何使用LoRA。仅仅使用一个LoRA也许还比较简单。只需要在基本工作流的基础上，再添加一个LoRA加载器的节点即可。如果要添加多个LoRA，就需要往里面继续加入LoRA加载器。这使得工作流变得很长，丧失了优雅和高效。今天，我来介绍在ComfyUI中使用LoRA的极简工作流。如果只使用一个LoRA的话，只需要两个节点。如果你需要再添加多个LoRA的话，只需要再添加一个LoRA节点。是不是非常简单呢？如果你喜欢看视频教程，那么我非常欢迎你观看本文所对应的视频(B站同名帐号)：安装必要的工具首先，我们需要安装称为“Efficiency Nodes”的一系列自定义节点。这需要你已经安装了 ComfyUI Manager。以下是安装自定义节点的步骤： 1️⃣ 打开 ComfyUI Manager 界面。 2️⃣ 点击安装自定义节点的按钮， 3️⃣在对话框中输入“efficiency”，并点击搜索。 4️⃣选择出现的第一个“效率节点”并安装。安装完成后点击重启按钮。构建基础 LoRA 工作流安装完效率节点后，就可以开始构建 LoRA 工作流了： 1️⃣ 双击空白处打开搜索节点的工具栏，输入“eff”，找到“Efficient Loader”节点。 2️⃣ 添加“Efficient Loader”节点，这个节点支持SD1.5，整合了多个功能如Checkpoint、VAE、Clip Skip 跳过层、LoRA、提示词、Latent宽高和批次数量。 3️⃣ 接下来，需要搭配一个采样器来生成图片。再次双击空白处，在搜索框输入“efficient”并选择一个基础版采样器。 4️⃣ 连接这两个节点。简单地用五条直线连接即可。 5️⃣设置模型和 LoRA 参数，写入提示词，然后生成图片。如何同时使用多个 LoRA 如果需要同时调用多个 LoRA，操作如下： 1️⃣ 在“Efficient Loader”上找到“lora_stack”的输入端。 2️⃣ 拖拽并选择“LoRA Stacker”，以叠加多个 LoRA。 3️⃣ 设置要叠加的 LoRA 数量，例如选择两个：一个调节笑容的…

ComfyUI

基于RF Inversion和Flux的人像美化工作流

ByVito 2024年11月14日2025年1月21日

在本文中，我将带您了解最新的人像美化工作流程，通过简单几步即可提升图像。这个流程专注于自然的增强效果，改善肌肤、发质以及布料的质感，同时避免照片看起来过度修饰。不论是低光环境的照片、模糊图像，还是年长对象的肖像，这一工作流都能提供帮助。工作流效果在介绍步骤之前，让我们先看看此工作流能够带来的改变：肌肤增强效果肌肤看起来更加平滑细致，同时保持自然效果。这不仅仅是基础的磨皮——睫毛、眉毛和头发的细节也得到了微妙提升，显得更平滑和清晰。连衣物的布料纹理也变得更干净和锐利。拯救废片该工作流可以改善一些具有挑战性的图像，例如因烟雾导致面部模糊的照片，可以澄清整体图像，而不会扭曲面部特征。降噪效果该流程能有效处理由于光照条件不足而产生的噪点，使它们显得更加清晰和精致。减龄效果如果您在处理年长人物的肖像，这个流程可以使对象的外观显得年轻。视频教程：模型和工作流下载工作流下载：https://www.liblib.art/modelinfo/d345b11851a04f12bf5305fdaa85d72f 💎发电专属内容（视频对应的进阶指南、更多示例、资源和问答支持）: https://www.patreon.com/posts/portrait-with-rf-115906538 模型安装：主要节点: 如果因为连不上国外网络而无法下载这些节点，可以使用云平台租赁显卡。在云平台上下载节点以后，在线使用或者下载到本地。开始使用该工作流程在深入学习之前，请先观看另一个视频，了解什么是RF Inversion以及它的更多应用场景：要尝试这个工作流程，您需要以下资源：步骤指南 1. 上传您的照片首先，将您的图像上传到该工作流。 2. 调整图像尺寸以适应SDXL 3. 使用“Sharp&Soft”节点调整锐度 4. 自动调整亮度、对比度和亮度 5. 自动生成提示词 6. 使用RF Inversion提升细节 7. 融合原始细节 8. 使用Sharp&Soft节点进一步增强纹理 9. 图像放大 10. 使用Image Lucy Sharpen节点进行微调 11. 使用SD1.5进行重绘

文本生成

1. 文本生成和质感

2. 宽高比灵活性

结论

生成人体

1. 结构精确度

2. 空间关系

3. 动作和姿势：芭蕾舞和瑜伽

结论

互动/提示词遵循

1. 处理复杂角度和互动

2. 提示词的遵循和表达

3. 图像质量和真实感

结论

手

1. 手部生成的逼真度

2. 不同场景的一致性

结论

人脸生成

1. 皮肤纹理和逼真度

2. 处理眼泪和情感细节

结论

最后的想法

Similar Posts

Leave a Reply Cancel reply