在 DALL-E 3 中创建角色并一步步调整
创建角色并进行一系列调整在 DALL-E 3 中并不难,关键在于让 DALL-E 3 在多轮对话中清楚地识别出你说的是哪张图片,并保留其中的元素或风格。这样,你就能轻松地使用 DALL-E 3 进行图片编辑了。
在本文中,我将首先介绍如何让 DALL-E 3 清楚地知道你说的是哪张图片。然后我们一起来创建一个角色,并进行一系列调整,并尽可能保持一致的角色。
本文用到的是 ChatGPT 里的 DALL-E 3,如果你是新手的话,可以先参考下这篇文章:重磅!ChatGPT 可以进行 AI 绘图了,来看教程吧
首先,我建议在自定义指令 (Custom Instructions) 包含下面的提示词:
Prompt: Assign a unique identifier to each image displayed beneath it in the format: “x” followed by a sequential number.
提示词: 为下方显示的每幅图像指定一个唯一标识符,格式为 “x “后跟一个顺序号。
中英文皆可,建议英文。这个方法是 X 用户@anukaakash 发明的。它的目的是让 DALL-E 3 每次生成图像后,都分配一个识别码。然后我们激活自定义指令之后,就可以通过识别码告诉 DALL-E 3 我们要操作的是哪张图片。
激活自定义指令之后,我们就可以开始在 DALL-E 3 中创建角色了。为此,我输入了下面的提示词:
Prompt: Create a 3D Pixar-style cartoon character named Juna, a young girl with a cheerful and friendly look. Juna has light brown skin, a cute button nose. Her hair is a curly, voluminous bob that falls to her shoulders, and she’s wearing a cozy beige knitted hat.
提示词:创建一个三维皮克斯风格的卡通人物,名叫朱娜,她是一个活泼可爱的年轻女孩。朱娜有着浅棕色的皮肤和可爱的纽扣鼻子。她的头发卷曲蓬松,披散在肩上,戴着一顶舒适的米色针织帽。
于是,DALL-E 3 就为我们生成了两张图片并分配了 x1
和 x2
两个识别码。
接着,我们就可以用这个识别码来指定图片,并进行调整啦。接下来给角色创造场景吧。
Prompt: Juna from Image x1 is sharing ice cream with a friendly dragon in a sunny park.
提示词: 图片 x1 中的朱娜在阳光明媚的公园里与一条友好的龙分享冰淇淋。
DALL-E 3 又为我们分配了两个图像识别码, x3
和 x4
。 我觉得 x3
更接近我原先创建的角色。接着我想让 x3
里的朱娜拿着棉花糖,可以这样写提示词:
Prompt: Juna from Image x3 is sharing a cotton candy with the same dragon from Image x3.
提示词: 图像 x3 中的朱娜图像 x3 中的同一条龙分享棉花糖。
经过多次尝试之后,x5
中的人物还是比较接近 x3
的。如果要把 x5
中的龙分离出来呢?于是我写了这个提示词:
Prompt: Image of a cheerful dragon from Image x5 wearing a white chef’s hat and apron, joyfully cooking with a wooden spoon and an assortment of colorful vegetables around it.
提示词: 图片 x5 中一条欢快的龙,头戴白色厨师帽,身穿围裙,拿着木勺和周围五颜六色的蔬菜,兴高采烈地做饭。
我试了两次,图片中的龙和 x5
中的龙都不怎么像,不过总算是保持了皮克斯动画的风格。
接着我想把 x6
中的朱娜放到 x8
里,于是有了下面的提示词:
Prompt: Create an image blending characters and elements from both Image x6 and Image x8, ensuring the characters’ consistency.
提示词: 创建一个图像,将图像 x6 和图像 x8 中的角色和元素混合在一起,确保角色的一致性。
顺便说一下,最近 DALL-E 3 调整了 DALL-E 3 的系统,默认为每一个图像都分配一个 ID。比如说我可以让 DALL-E 3 展示上面两张图片的 ID。
但是我个人觉得这个识别码太长,还不如用 x
来的方便。它也可以用来指定图片,但同样不一定能保证角色的一致性。比如我想让 x9
中的朱娜拿着棉花糖,可以这样写提示词:
Prompt: Please have the girl from rGAIvC9U9GwISUgP hold a cotton candy in her hand in the same scene.
提示词:请让 rGAIvC9U9GwISUgP 中的女孩在同一场景中手持棉花糖。
如果想实现更高程度的角色一致性的话,可以尝试我在另一篇文章中介绍的方法:实现 DALL-E 3 角色一致性, 99% Character Consistency