重磅！ChatGPT 可以进行 AI 绘图了，来看教程吧

ByVito 2023年11月13日2023年11月13日

前几个月，OpenAI 上线了代码解释器，从此人们无需代码，只要通过自然语言，就可以进行大数据分析，从此人人都是数据分析师。就在最近，又上线了 DALL·E 3，通过自然语言，在 ChatGPT 就可以进行 AI 绘画，从此人人都是数字艺术家。

比如说，我在推特上 @LearnAI_MJ 看到的最有创意的提示词就是 “A painter painting a canvas, where the canvas shows the same painter painting a canvas, and so on (一个画家在画布上作画，画布上显示的是同一个画家在画布上作画，以此类推)”。把这段文本输入 DALL·E 3，ChatGPT 就为我生成了下图：

从此在数字艺术领域，比拼的不是技术，而是创意。

那么如何在 ChatGPT 中使用 DALL·E 3 进行 AI 绘画呢？在下面的文章中，我将从基本的方法开始，一步步过渡到 DALL·E 3 的高级用法。

Table of Contents

1. 如何激活 DALL·E 3

目前 DALL·E 3 仅对部分 ChatGPT Plus 用户开放，名额由 OpenAI 自行决定。它的入口和联网功能，代码解释器，插件功能一样，都位于 GPT-4 按钮菜单中。

选中以后，在聊天框里输入提示词就可以作画了。

2. 如何写提示词

和 ChatGPT 的用法一样，你只需要把 DALL·E 3 当作一个助理，告诉你对图片的要求即可，比如说 “A serene mountain landscape during autumn. (秋季宁静的山景)”。

DALL·E 3 甚至还可以作为你的提示词助理，在你没有 Idea 的时候帮你写提示词。大家都知道 ChatGPT 的目前的训练时间截至 2022 年 1 月，所以它不知道 DALL·E 3，更加不知道 Midjourney ，所以它不知道如何写 AI 绘画的提示词。但是 DALL·E 3 却知道！来看看我们如何把它作为提示词助理，比如我输入如下提示词：

Prompt: Providing me 4 image prompts that will be universally appreciated for their usefulness and humor. (为我提供 4 个详细的图片提示，它们的实用性和幽默感将得到普遍赞赏。)

于是乎 DALL·E 3 就为我生成了 4 个非常详细的提示词。

当然！以下是四则图片提示，旨在体现实用性和幽默感：
图片： 一只猫戴着安全护目镜和建筑帽，站在一个有玩具推土机和起重机的微型建筑工地旁。这只猫似乎在视察工地，表情严肃，旁边一只穿着西装的老鼠拿着一张小蓝图。背景是一个标牌，上面写着 “Paws Construction Co.” （爪子建筑公司）。
插图： 健身房里的一组不同蔬菜。西兰花在举重，胡萝卜在跑步机上，西红柿在做瑜伽。这个场景描绘了他们挥汗如雨、挑战极限的场景。在健身房入口上方，写着 “蔬菜健身俱乐部”。
漫画：一条一脸疑惑的鱼在一个装满水的鱼缸里阅读一本名为 “如何游泳 “的书。鱼缸外，一只狗和一只鸟在咯咯地笑着，互相窃窃私语，努力忍住笑声。
水彩画： 一只年迈的乌龟坐在电脑桌前，戴着眼镜，表情沮丧。它正试图点击屏幕上的一个弹出窗口，上面写着：”点击这里，加快您的电脑速度！” 旁边的一只小野兔用爪子捂住嘴巴，努力忍住不笑。
您想把这些变成图片吗？

DALL·E 3 默认会生成 4 张图片。而我刚好让它生成了 4 个提示词，于是它就问我是否要把这些提示词变成图片。我回答了 “Yes”，然后 DALL·E 3 就为我生成了 4 张图片。

3. 如何下载图片

当你把鼠标悬停在图片上时，就会出现下载按钮，点击按钮即可完成下载。

还有一种方式是点击图片，然后在打开的页面上也会出现下载按钮，除此之外，你还可以看到用于生成该图片的提示词。

4. 如何生成不同宽高比的图片

DALL·E 3 支持 3 种分辨率：

正方形（1024×1024）：这是默认分辨率，适合大多数普通图像。
宽屏（1792×1024）：适合风景、全景或任何需要水平方向的图像。
高（1024×1792）：最适合全身肖像、高大结构或任何需要垂直方向的图像。

DALL·E 3 会根据提示词的内容自动选择分辨率，你也可以指定一个分辨率。举个例子来说，比如我输入下面的提示词：

Prompt: Full body portrait of a cat wearing safety goggles and a construction hat, inspecting the site with a serious expression. In the background, there’s a sign that reads, “Paws Construction Co.” (一只猫的全身像，它戴着安全护目镜和施工帽，表情严肃地检查工地。背景中，有一个写着 “Paws Construction Co.” 的标志。)

根据提示词中 full body portrait (全身照) 这个词，DALL·E 3 会选择 1024×1792 这个分辨率，如下图所示。

你还可以使用 “vertical images (竖向图)” 这个词输出 1024×1792 的图片，或者直接在提示词中指定这个分辨率。

如果要生成 1792×1024 的图片，我可以这样调整提示词：

Prompt: A panoramic view of a cat wearing safety goggles and a construction hat, standing next to a miniature construction site with toy bulldozers and cranes. The cat appears to be inspecting the site with a serious expression, while a mouse in a suit holds a tiny blueprint next to it. In the background, there’s a sign that reads, “Paws Construction Co.” (一只戴着安全护目镜和建筑帽的猫站在一个有玩具推土机和起重机的微型建筑工地旁的全景。这只猫似乎在视察工地，表情严肃，旁边一只穿着西装的老鼠拿着一张小蓝图。背景中，有一个写着 “Paws Construction Co.” 的标志。)

你还可以用 “wide images (宽幅图像) ” 这个词输出 1792×1024 的图片，或者直接指定这个分辨率。

5. 如何修改图片

你只需要指定要修改的图片以及怎么修改即可，比如我要把上面生成的四张图中的第一张中的场景由室内变成室外，可以通过下面这个提示词进行修改：

Prompt: Could you maintain the appearance of the characters, including their clothing and accessories, as shown in the first image above, but change the setting from indoors to outdoors? (能否保留人物的外观，包括服装和配饰，如上图所示，但将场景从室内改为室外？)

DALL·E 3 修改后的图片如图所示：

DALL·E 3 其实是把提示词修改了一下然后重新生成了另一张图像，并没有在原有的基础上进行修改。所以尽管我要求保持人物一致，但实际上 DALL·E 3 生成的是另一只猫和老鼠。

总结

DALL·E 3 又降低了 AI 绘画的门槛，基本上会用 ChatGPT 的人都会很快掌握 DALL·E 3。当然，目前的艺术效果和对图像精确的控制和 Midjourney 是有差距的。不过对于大多数用户来说，功能已足够好了。你怎么看呢？欢迎发消息进行探讨。

DALL·E 3

DALL-E 3 不只是文生图！10 个案例颠覆认知

ByVito 2023年11月14日2023年11月14日

DALL-E 3 的出现又一次颠覆了 AI 绘图行业，它生成的图片迅速走红社交媒体。很多人被它生成文字和超现实图像的能力所吸引，但并没有发掘它的另一个强大功能—把你脑中的 Idea 变成现实中的图像。很多时候一张图胜过千言万语，当语言无法清楚表达你的想法时，不妨考虑把它交给 DALL-E 3。你只需要告诉 DALL-E 3 你的想法，并让它把想法可视化即可。 DALL-E 3 会自动根据你的想法帮你写提示词，并最终生成图像。我在这篇文章里发掘了10个使用场景，希望能给你一些灵感。如果你还没有在 ChatGPT 里使用过 DALL-E 3 的话，可以看看这篇文章： 👉 重磅！ChatGPT 可以进行 AI 绘图了，来看教程吧活动策划提示词: 我正在为公司的年会组织一场企业活动，需要一些可视化方面的帮助。概念是这样的：活动将在一个宽敞的会议中心举行，天花板很高。主厅将有一个大舞台，舞台背景将显示我们公司的徽标。在舞台的两侧，将有两个大型 LED 屏幕显示演示文稿和视频。我希望为与会者摆放一排排椅子，中间有一条过道通向舞台。在主厅右侧，我设想设置一个交流区，摆放圆桌，每张桌子上都铺有品牌桌布。这个区域应该有更轻松的氛围，有盆栽植物和柔和的灯光。在左侧，我想为我们的合作伙伴和赞助商设立展台。每个展位都要有背景墙、柜台和一些宣传材料。在入口处，我设计了一个带有我们品牌标识的登记台，两侧有两条横幅。在登记台后面，应该有一个显示活动日程的电子屏幕。最后，餐饮区将设在最远处，那里有自助餐桌、吧台和休息区。您能用 3D 效果图帮我想象一下这样的布置吗？ DALL-E 通过4张图片展示了公司活动现场的效果，并做出了以下说明：以下是企业活动的可视化设置：主厅：这张图片展示了会议中心宽敞的主厅。大舞台的背景墙上印有公司徽标，十分醒目。舞台两侧的 LED 屏幕可随时播放演示文稿，一排排供与会者使用的椅子整齐地排列在通往舞台的中央过道上。交流区：这是主会场旁边的交流区。铺着品牌桌布的圆桌散布各处。盆栽植物和柔和的灯光为与会者营造出轻松惬意的氛围。合作伙伴和赞助商展位：此图重点展示了合作伙伴和赞助商的专用空间。每个展位都各具特色，配有背景墙、柜台和宣传材料。这种布局便于与会者浏览。入口和食品区：会展中心入口处有一个醒目的登记台，两侧有横幅标语。登记台后面的电子屏幕显示着活动日程。在背景中，可以看到餐饮区，包括自助餐桌、吧台和休息区。我希望这些可视化设计能帮助您将企业活动的愿景变为现实！如果您有任何反馈或需要进一步调整，请告诉我。景观设计提示词：我想制作 3D 效果图，以直观地展示花园设计布局。我的想法是这样的：…

DALL·E 3

DALL-E 3 中神奇的格子布局

ByVito 2023年11月14日2023年11月14日

每次探索 DALL-E 3，总能给我惊喜。在上一篇文章中，我利用上下左右的 4 格布局实现了高度的角色一致性。实际上，DALL-E 3 中的格子布局还有很多妙用。格子布局的美妙之处在于它的对称性、组织性，以及它如何将不同的元素和谐地结合在一起，创造出一个有凝聚力的视觉叙事。 DALL-E 3 能够在精心排列的网格中布局和创造图像，使每个网格都讲述一个故事，最终变成一个奇妙的画廊。本文总结了 9 种网格的使用案例，让我们一起探索一下吧！展示集合 Prompt: Antique pocket watches arranged in a 4×4 grid, with each watch in a crystal-clear display case. 提示词：古董怀表排列成 4×4 的方格，每块表都放在一个水晶般透明的展示盒中。 Prompt: Wide 3D Render: iconic monuments from different countries arranged in a 3×2 grid, with each monument encased in a…

DALL·E 3

厉害了！这个 GPTs 看到1张图，就能复刻3张出来

ByVito 2023年11月22日2023年11月22日

你是否曾经在网上看到一张图，很想用 DALL-E 或者 Midjourney 把它画出来，却不知道如何写提示词。有了我在 ChatGPT 上造的 GPT，可以帮你解决这个问题。它主要有以下特色功能：我给这个 GPT 取名叫 Image Recreator。我并没有像之前造的 GPT 那样搞中英文两个版本，因为这个 GPT 使用很简单，只需要上传图片并提交即可。即使图片需要进行调整，也可以用中文提示词，它会在后台自动帮你翻译成英文。这是它的界面：我来演示一下它的效果吧。我上传了一张皮克斯风格的动画，描述了一个小男孩坐在公园长椅上吃冰激凌，旁边有一只可爱的小龙。我直接上传并提交后，Image Recreator 就帮我生成了 3 张图，还有图像识别码和 Midjourney 提示词，如下图所示。我看了下生成的3张图片的提示词，第1张就是3D卡通风格，第2张是3D皮克斯风格，第三张是3D迪士尼风格。第2张复刻了皮克斯的风格，但是小男孩和小龙的姿势和原图有些不符。所以我下了如下提示词进行调整： Prompt: Image x2 is good. However, it would be better if the boy’s gaze were directed towards the little dragon rather than the camera while hold the ice cream….

DALL·E 3

一招让你的图像更惊艳！DALL-E 3 自定义指令魔法

ByVito 2023年11月14日2023年11月14日

DALL-E 3 的简单易用让 AI 绘画变得更普及了。只需要输入一个简单的提示词，DALL-E 3 就能生成一幅非常有场景感的照片。比如我输入了 “年轻女人的照片” 这个提示词，DALL-E 3 生成的女人照片不仅有不同的场景，而且还来自多民族。对于中国人来说，最大的卖点莫过于支持中文提示词。反观另一个 AI 绘图工具，Midjourney，对新手就不那么友好了。它的提示词并不通俗易懂，有时候简直像魔法师的咒语一样。它还有一堆参数需要掌握，有时候会让新手感到困惑。比如同样输入 “photo of young woman” 这个提示词，如果你加上–style raw 这个参数，得到的结果可能是这样的：总而言之，Midjourney 需要掌握很多提示词技巧，而 DALL-E 3 可以自动帮你生成内容非常丰富的提示词。尽管如此，在我看来，它生成的提示词还不够丰富，有很多优化的空间。并且如果你在提示词中包含侵权的对象，比如皮卡丘的话，DALL-E 3 因为它的内容政策会拒绝你的图片请求。为此，我设计了下面的自定义指令 (Custom instructions)。把它添加到你的自定义指令中，就能一劳永逸地提升每一张图片的效果，也可以解决侵权问题。如果你还不了解 DALL-E 3 的侵权问题和解决方案的话，可以阅读这篇文章：快看！如何绕过 DALL-E 3 的版权限制需要说明的是，自定义指令是 ChatGPT Plus 用户的一项功能，如果你是 DALL-E 3 的新手的话，可以先阅读这篇文章：重磅！ChatGPT 可以进行 AI 绘图了，来看教程吧自定义指令的位置很好找，只需要在 ChatGPT 界面中点击自己的用户名或者头像，在弹出的菜单中就可以找到。点击自定义指令以后，把下面的提示词填入即可。下面是英文的自定义指令。当你用英文的自定义指令是，如果在 DALL-E 3 中输入中文的提示词，同样也可以生成图片，只是它的响应的语言是英文。…

DALL·E 3

DALL-E 3 中18 种绝美艺术风格

ByVito 2023年11月14日2023年11月14日

DALL-E 3 作为一种先进的图像生成技术，成功地跨越了时间和空间，将各个时代和文化的艺术风格融合在了一起。本文将介绍 DALL-E 3 中 18 种独特的艺术风格，既有对传统手工艺的致敬，也有对现代科技的探索，更不乏对未来艺术的设想。在这些风格中，我们可以看到古老的东西方绘画技巧与现代数字艺术的交融，呈现出一种跨时代的美学。精致的手工艺与高科技的三维构图相互映衬，展现出了一种令人惊叹的艺术张力。如果此前从未在 ChatGPT 中使用过 DALL-E 3，可以先看看这篇文章：重磅！ChatGPT 可以进行 AI 绘图了，来看教程吧木刻艺术 Prompt: A circular wood burned artwork depicting a elephant with intricate mandala-like patterns on its skin and geometric shapes surrounding it. 提示词：一个圆形的木刻艺术品，描绘的是一头大象，它的皮肤上有复杂的曼陀罗状图案，周围环绕着几何图形。 Prompt: A square wood burned artwork depicting a regal lion with a majestic…

DALL·E 3

45个 DALL-E 3 使用案例 (附提示词)

ByVito 2023年11月13日2023年11月13日

DALL-E 3 是 OpenAI 的又一大作，相比于此前的 DALL-E 3 是一个重磅提升。借助于 Transformer 模型优秀的自然语言能力，它可以精准地理解你的设计需求，并近乎如实地反映在画面上。惊艳于它强大的能力，我探索出了45个使用案例，几乎涵盖了所有类型的设计。掌握了这个工具，你就拥有了一个免费的设计师。无论你从事什么行业，它总能在一些场景下帮到你。虽然它在生成文字上会出些小错误，但这个微小的问题可以通过其他工具来修复。 DALL-E 3 目前有两个入口，一个是在浏览器输入 bing.com/create 进入 (免费)，还一个是 ChatGPT Plus。两种最大的区别是，ChatGPT 里面的 DALL-E 3 除了能生成方形的图之外，还可以生成 1792×1024 和 1024×1792 的图片。如果你还没有在 ChatGPT 内体验过，可以阅读这篇文章：重磅！ChatGPT 可以进行 AI 绘图了，来看教程吧广告海报 Prompt: Design impactful advertisement posters for a [specific product or service e.g., ‘sneakers’], emphasizing its [unique selling point or feature e.g.,…

1. 如何激活 DALL·E 3

2. 如何写提示词

3. 如何下载图片

4. 如何生成不同宽高比的图片

5. 如何修改图片

总结

Similar Posts

Leave a Reply Cancel reply