GPT DALL-E 3 竟然可以做动图GIF

仅仅通过一个简单的提示词,就可以在 DALL-E 3 里生成惊艳的图像。可是,DALL-E 3 配合 ChatGPT 能做的事情不止于此!如果还没有在 ChatGPT 里用过 DALL-E 3 的话,可以看看这篇文章:重磅!ChatGPT 可以进行 AI 绘图了,来看教程吧

在上一篇文章中我介绍了 DALL-E 3 格子布局的神奇用法。今天让我来介绍如何通过这种布局做出动图GIF。动图有很多用处,比如可以作为表情发给微信好友。

简单来说分为 3 步:

  1. 用 DALL-E 3 生成九宫格的图片。
  2. 定位九宫格交叉点的坐标。
  3. 把坐标告诉ChatGPT里面的代码解释器 (高级数据分析),并让它截切并生成动图。

让我们通过实际案例看看如何实现吧。

1️⃣首先,在 DALL-E 3 中输入这个提示词:

Prompt: 3×3 photo grid of a joyful clown’s facial expressions, progressing from a slight smile to bursting laughter. All the grids have the same size and are seamlessly connected without any gaps.

提示词: 3×3 照片网格,显示一个欢乐小丑的面部表情,从微微一笑到开怀大笑。所有网格大小相同,无缝连接,不留空隙。

2️⃣接着 DALL-E 3 就生成了如下图像。

3️⃣虽然在提示词里要求每个网格的大小一致,实际还是略有偏差。如果不能精确地裁切,最终可能会留下难看的白边,且图像中的主体位置会偏移,如下图所示。

4️⃣其实,只要 “高级数据分析” 知道 “井” 字网格交叉的 4 个点的坐标,就可以通过 Python 代码进行精确定位。然而,找到这 4 个点的坐标并不容易。我甚至还尝试在 4 个点上画红色叉叉,然后上传到 GPT-4V 进行定位。然而 GPT-4V 目前并不具备精切定位某点的坐标的能力。多次尝试后,我找到了最佳方法。

5️⃣ 用 Windows 自带的画图工具打开九宫格图片,把鼠标指到交叉点上,右下角就有它的坐标。如果你的系统上没有画图工具的话,其他工具也可以。比如在 Photoshop 中,鼠标指到某点,信息面部就可以显示坐标。

6️⃣有了坐标以后,就可以给 “高级数据分析” 分配任务啦。于是我写了这个提示词:

Prompt: I have an image divided into a 3×3 grid, with each grid having a different size. I’ll provide you with the coordinates of the four points of intersection between the two horizontal lines and the two vertical lines in the figure. (X1, Y1) = (338, 347) (X2, Y2) = (684, 347) (X3, Y3) = (338, 680) (X4, Y4) = (684, 680) With the coordinates in hand, slice the photo grid and create a GIF sequence using the 1st, 2nd, 5st, 6th, 7th, 8th and 9th frames in that order. Duration = 500

提示词: 我有一张被划分成 3×3 个网格的图片,每个网格的大小不同。我将为您提供图中两条水平分割线和两条垂直分割线之间的四个交点的坐标。 (X1, Y1) = (338, 347) (X2, Y2) = (684, 347) (X3, Y3) = (338, 680) (X4, Y4) = (684, 680) 得到坐标后,将照片网格切片,并依次使用第 1、2、5、6、7、8 和 9 网格创建 GIF 序列。持续时间 = 500

这里的持续时间控制动图变换帧的快慢。很快,高级数据分析就生成了动图的下载链接。

以下案例的媒介 Medium 都是照片 (Photo)。实际上也可以用其他媒介,比如卡通,水彩画等等。只需要把提示词里的 “3×3 照片网格” 中的照片变成其他媒介即可。

Prompt: 3×3 photo grid of a dancing robot, progressing from stiff movements to fluid, energetic grooves. All the grids have the same size and are seamlessly connected without any gaps.

提示词: 一个跳舞机器人的 3×3 照片网格,从僵硬的动作发展到流畅、充满活力的舞步。所有网格大小相同,无缝连接,不留缝隙。

Prompt: I have an image divided into a 3×3 grid, with each grid having a different size but separated by white lines. I’ll provide you with the coordinates of the four points of intersection between the two horizontal white lines and the two vertical white lines in the figure. (X1, Y1) = (342, 339) (X2, Y2) = (679, 339) (X3, Y3) = (342, 682) (X4, Y4) = (679, 682) With the coordinates in hand, slice the photo grid and create a GIF sequence using the 1st, 2nd, 3rd, 2nd, 5th, 6th, 5th and 4th frames in that order. Duration = 300

提示词: 我有一张被划分成 3×3 个网格的图片,每个网格的大小不同,但都用白线隔开。我将为您提供图中两条水平白线和两条垂直白线之间的四个交点的坐标。 (X1, Y1) = (342, 339) (X2, Y2) = (679, 339) (X3, Y3) = (342, 682) (X4, Y4) = (679, 682) 掌握坐标后,切分照片网格,并依次使用第 1、2、3、2、5、6、5 和 4 网格创建 GIF 序列。持续时间 = 300

Prompt: 3×3 photo grid of a genie’s emergence from a lamp, starting with mystical smoke to a grand, magical appearance. All the grids have the same size and are seamlessly connected without any gaps.

提示词: 3×3 照片网格,描绘精灵从神灯中现身,从神秘的烟雾开始到盛大而神奇的出场。所有网格大小相同,无缝连接,不留空隙。

Prompt: 3×3 photo grid of a Chinese dragon’s fire-breathing warm-up, progressing from gentle puffs of smoke to a roaring flame. All the grids have the same size and are seamlessly connected without any gaps.

提示词: 中国龙喷火热身的 3×3 照片网格,从轻柔的烟雾到咆哮的火焰。所有网格大小相同,无缝连接,不留空隙。

有时候,生成的网格线很粗,这样裁切后生成的 GIF 最终会留有一些黑色的边。如果想要更美观的话,可以用在线的裁剪工具把这些黑边裁剪掉,比如 ezgif.com。

Prompt: 3×3 photo grid of a sports car transforming into a robot. All the grids have the same size and are seamlessly connected without any gaps.

提示词: 跑车变身机器人的 3×3 照片网格。所有网格大小相同,无缝连接,没有任何缝隙。

类似文章

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注