重磅!ChatGPT 可以进行 AI 绘图了,来看教程吧
前几个月,OpenAI 上线了代码解释器,从此人们无需代码,只要通过自然语言,就可以进行大数据分析,从此人人都是数据分析师。就在最近,又上线了 DALL·E 3, 通过自然语言,在 ChatGPT 就可以进行 AI 绘画,从此人人都是数字艺术家。
比如说,我在推特上 @LearnAI_MJ 看到的最有创意的提示词就是 “A painter painting a canvas, where the canvas shows the same painter painting a canvas, and so on (一个画家在画布上作画,画布上显示的是同一个画家在画布上作画,以此类推)”。把这段文本输入 DALL·E 3,ChatGPT 就为我生成了下图:
从此在数字艺术领域,比拼的不是技术,而是创意。
那么如何在 ChatGPT 中使用 DALL·E 3 进行 AI 绘画呢?在下面的文章中,我将从基本的方法开始,一步步过渡到 DALL·E 3 的高级用法。
1. 如何激活 DALL·E 3
目前 DALL·E 3 仅对部分 ChatGPT Plus 用户开放,名额由 OpenAI 自行决定。它的入口和联网功能,代码解释器,插件功能一样,都位于 GPT-4 按钮菜单中。
选中以后,在聊天框里输入提示词就可以作画了。
2. 如何写提示词
和 ChatGPT 的用法一样,你只需要把 DALL·E 3 当作一个助理,告诉你对图片的要求即可,比如说 “A serene mountain landscape during autumn. (秋季宁静的山景)”。
DALL·E 3 甚至还可以作为你的提示词助理,在你没有 Idea 的时候帮你写提示词。大家都知道 ChatGPT 的目前的训练时间截至 2022 年 1 月,所以它不知道 DALL·E 3,更加不知道 Midjourney ,所以它不知道如何写 AI 绘画的提示词。但是 DALL·E 3 却知道!来看看我们如何把它作为提示词助理,比如我输入如下提示词:
Prompt: Providing me 4 image prompts that will be universally appreciated for their usefulness and humor. (为我提供 4 个详细的图片提示,它们的实用性和幽默感将得到普遍赞赏。)
于是乎 DALL·E 3 就为我生成了 4 个非常详细的提示词。
当然!以下是四则图片提示,旨在体现实用性和幽默感:
- 图片: 一只猫戴着安全护目镜和建筑帽,站在一个有玩具推土机和起重机的微型建筑工地旁。这只猫似乎在视察工地,表情严肃,旁边一只穿着西装的老鼠拿着一张小蓝图。背景是一个标牌,上面写着 “Paws Construction Co.” (爪子建筑公司)。
- 插图: 健身房里的一组不同蔬菜。西兰花在举重,胡萝卜在跑步机上,西红柿在做瑜伽。这个场景描绘了他们挥汗如雨、挑战极限的场景。在健身房入口上方,写着 “蔬菜健身俱乐部”。
- 漫画:一条一脸疑惑的鱼在一个装满水的鱼缸里阅读一本名为 “如何游泳 “的书。鱼缸外,一只狗和一只鸟在咯咯地笑着,互相窃窃私语,努力忍住笑声。
- 水彩画: 一只年迈的乌龟坐在电脑桌前,戴着眼镜,表情沮丧。它正试图点击屏幕上的一个弹出窗口,上面写着:”点击这里,加快您的电脑速度!” 旁边的一只小野兔用爪子捂住嘴巴,努力忍住不笑。
您想把这些变成图片吗?
DALL·E 3 默认会生成 4 张图片。而我刚好让它生成了 4 个提示词,于是它就问我是否要把这些提示词变成图片。我回答了 “Yes”,然后 DALL·E 3 就为我生成了 4 张图片。
3. 如何下载图片
当你把鼠标悬停在图片上时,就会出现下载按钮,点击按钮即可完成下载。
还有一种方式是点击图片,然后在打开的页面上也会出现下载按钮,除此之外,你还可以看到用于生成该图片的提示词。
4. 如何生成不同宽高比的图片
DALL·E 3 支持 3 种分辨率:
- 正方形(1024×1024): 这是默认分辨率,适合大多数普通图像。
- 宽屏(1792×1024): 适合风景、全景或任何需要水平方向的图像。
- 高(1024×1792): 最适合全身肖像、高大结构或任何需要垂直方向的图像。
DALL·E 3 会根据提示词的内容自动选择分辨率,你也可以指定一个分辨率。举个例子来说,比如我输入下面的提示词:
Prompt: Full body portrait of a cat wearing safety goggles and a construction hat, inspecting the site with a serious expression. In the background, there’s a sign that reads, “Paws Construction Co.” (一只猫的全身像,它戴着安全护目镜和施工帽,表情严肃地检查工地。背景中,有一个写着 “Paws Construction Co.” 的标志。)
根据提示词中 full body portrait (全身照) 这个词,DALL·E 3 会选择 1024×1792 这个分辨率,如下图所示。
你还可以使用 “vertical images (竖向图)” 这个词输出 1024×1792 的图片,或者直接在提示词中指定这个分辨率。
如果要生成 1792×1024 的图片,我可以这样调整提示词:
Prompt: A panoramic view of a cat wearing safety goggles and a construction hat, standing next to a miniature construction site with toy bulldozers and cranes. The cat appears to be inspecting the site with a serious expression, while a mouse in a suit holds a tiny blueprint next to it. In the background, there’s a sign that reads, “Paws Construction Co.” (一只戴着安全护目镜和建筑帽的猫站在一个有玩具推土机和起重机的微型建筑工地旁的全景。这只猫似乎在视察工地,表情严肃,旁边一只穿着西装的老鼠拿着一张小蓝图。背景中,有一个写着 “Paws Construction Co.” 的标志。)
你还可以用 “wide images (宽幅图像) ” 这个词输出 1792×1024 的图片,或者直接指定这个分辨率。
5. 如何修改图片
你只需要指定要修改的图片以及怎么修改即可,比如我要把上面生成的四张图中的第一张中的场景由室内变成室外,可以通过下面这个提示词进行修改:
Prompt: Could you maintain the appearance of the characters, including their clothing and accessories, as shown in the first image above, but change the setting from indoors to outdoors? (能否保留人物的外观,包括服装和配饰,如上图所示,但将场景从室内改为室外?)
DALL·E 3 修改后的图片如图所示:
DALL·E 3 其实是把提示词修改了一下然后重新生成了另一张图像,并没有在原有的基础上进行修改。所以尽管我要求保持人物一致,但实际上 DALL·E 3 生成的是另一只猫和老鼠。
总结
DALL·E 3 又降低了 AI 绘画的门槛,基本上会用 ChatGPT 的人都会很快掌握 DALL·E 3。当然,目前的艺术效果和对图像精确的控制和 Midjourney 是有差距的。不过对于大多数用户来说,功能已足够好了。你怎么看呢?欢迎发消息进行探讨。