ChatGPT代码解释器批量编辑图片真香!

ByVito 2023年11月13日2023年11月13日

OpenAI的确不擅长起名字。Code Interpreter (代码解释器)乍听上去像是跟编程有关的东西，然而实际上完全不是。它能利用Python代码批量处理几千张图片，因此得名。你可以讲要处理的图片压缩为一个512M以内的文件，然后直接上传到ChatGPT。

有了Code Interpreter，你不在需要学习其他软件来批量处理图片了。你可以像跟朋友对话一个描述你的需求，然后让它裁剪掉不必要的背景、将静态图片转换为动感的 GIF、添加水印以保护版权，甚至识别人脸并模糊以保护隐私。

让我们用实际案例看看它的强大之处吧。

Table of Contents

删除图像主题周围空白背景

当我们需要把图片展示在网页上或者PPT中，为了保持风格的统一，或者提高图片的加载速度，会想要删掉图像主体部分周围的空白背景。

我们只需要把要处理的图片压缩成一个包，上传到Code Interpreter，然后再写一个Prompt就可以搞定。

例如，我把以下三张需要处理的图片压缩一下。

然后上传到Code Interpreter，再提交这样一个Prompt就可以啦：

请删除压缩包中图片主体周围的空白空间或多余空间。

然后我们看下Code Interpreter的处理过程：

明白了。我将处理ZIP 文件中的图像，删除图像主体周围任何不必要的空白。
首先，我将从 ZIP 文件中提取图像并将其加载到内存中。然后，我将继续进行图像处理步骤。开始吧。
我已经处理了 6 张图像，并删除了每张图像周围不必要的空白。现在，我将把这些图像压缩回 ZIP 文件并提供下载链接。
处理后的图像已成功压缩为 ZIP 文件。
您可以从以下链接下载包含已处理图像的 ZIP 文件：
下载处理后的图像

点击ChatGPT提供的下载链接就可以下载处理好的图片啦。这是删除了多余白色背景后的三张图片：

图片转GIF动画

GIF要比静态的图片更具有视觉吸引力，与视频相比具有体积更小的优势，你可以用Code Interpreter把图片转换成GIF提高社交媒体的参与度。

我们只需要把要处理的图片压缩成一个包，上传到Code Interpreter，然后再写一个Prompt就可以搞定。

请将zip包中的图片转换为GIF。图像应按名称顺序排列。生成的 GIF 应具有循环动画，并且每帧之间有 500 毫秒的帧延迟。

这是我用来生成GIF的三张图片：

来看下ChatGPT的处理过程：

我已经成功将图像转换为 GIF，帧延迟为 500 毫秒。这是您要求的 GIF：
下载GIF

这是最终生成的GIF:

除了直接转GIF，还可以添加其他效果，比如淡入淡出。

图片加水印

水印是宣告图片所有权的通常做法。摄影师、艺术家和内容创作者经常添加水印，以确保他们的作品得到认可并防止其他人声称其为自己的作品。用Code Interpreter添加水印也很简单：

该压缩包有多个图像以及我的logo。 logo的文件名是“logo”。请你将logo作为水印添加到每个图像中。水印应位于距图像右下角 10 个像素的位置；保持原始宽高比；大小为相对于图像宽度或高度的 5%；透明度 50% ；背景要透明。最后，请提供处理后图像的下载链接。

The zip package includes multiple images along with my logo. The filename of the logo is “logo”. I need assistance in adding the logo as a watermark to each image in the package. The watermark should be positioned 10 pixels from the bottom right corner of the image, with its original aspect ratio, a size of 5% relative to the image’s width or height, a transparency of 50%, and transparent background. Finally, please provide a download link for the processed image.

以下是我要处理的图片：

来看看ChatGPT的处理过程：

最终两张图片的右下角都添加了水印。你也可以通过修改Prompt来调整水印的大小，位置和透明度。你当然可以上传更多图片，不过目前可以上传到Code Interpreter的最大文件大小为512M。

除了加水印以外，还可以批量给图片添加文字，添加其他图片等。

人脸识别

在有些场合，处于保护隐私或个人身份的目的，我们需要在人脸上打马赛克。这个操作在Code Interpreter里面还是只需要一句话就搞定。

先看下原先的两张美女肖像：

然后把下面这个Prompt交给代码解释器：

该压缩包有多张图像。请识别每张图像中出现的面孔。识别出脸部后，我需要您创建马赛克以覆盖每个图像中的脸部。最后，为我提供处理后图像的下载链接。

最终打开的两张图片效果如下：

除了打马赛克以外，还可以把识别的脸部做模糊处理，用其他图像覆盖住或者把所有识别出的人脸保存为另一个图像。

图像降噪

在弱光下拍摄的照片都会很考验照相机的性能，尽管现在的相机的感光能力越来越强，但在某些弱光拍摄条件下，照片难免会有噪点。例如下面这张照片里的黄色区域存在亮度不均匀的小糙点。图像降噪技术可以减少这些噪点，提升画质。

把这张照片上传到代码解释器之后，输入以下Prompt:

去除图像中的噪声，同时保留其纹理和细节。完成后，请分享处理后图像的下载链接。

ChatGPT输出了处理过程：

为了去除图像中的噪声，我们可以使用多种方法。最常见的方法之一是使用去噪滤波器，例如非局部均值去噪算法。该算法的工作原理是比较图像中的所有像素，而不是仅比较局部邻域中的像素，因此它可以在去除噪声的同时保留细节。
让我们继续这个方法，然后你可以检查结果是否令人满意。如果没有，我们可以尝试其他方法。
图像已经过处理，噪声已减少。您可以从以下链接下载去噪后的图像：
下载去噪图像
请查看图像并让我知道降噪效果是否令人满意。如果没有，我们可以尝试不同的方法或者调整当前方法的参数。

如果对最终的图片效果不满意，还可以给ChatGPT提修改意见。我这里只演示了一张图片，你可以把要处理的多张图片压缩上传，不要超过512M就好了。

基础图像处理

Code Interpreter还可以执行基础的图像批量操作，如缩放，裁剪，旋转，模糊，锐化等。

图像缩放

图像缩放就是改变图像的大小。可以通过指定新的宽度和高度或按一个比例缩放。在缩放过程中，图像的像素值会调整以适应新的尺寸，同时保留视觉内容和宽高比。 Prompt举例：

将此图像缩放为 800 像素的宽度，同时保持其纵横比。
请将给定图像按原始尺寸缩小 50%。
我希望你将图像放大 2.5 倍。
你能将这张图片的大小调整为 600 像素的高度并保持其原始纵横比吗？
我需要将此图像缩放至 1920×1080 像素的分辨率。

图像裁剪

图像裁剪是从图像中选择并提取特定的感兴趣区域 (ROI)，同时丢弃其余部分。裁剪是通过指定所需 ROI 的坐标或尺寸来实现的。所选区域可以通过其左上角和右下角坐标或其起点的宽度和高度来定义。裁剪时，指定 ROI 内的像素将被保留，图像的其余部分将被丢弃。

Prompt举例：

从点 (100,100) 开始裁剪图像，宽度为 500 像素，高度为 300 像素。
请从图像中提取由坐标（300,200）到（800,600）定义的感兴趣区域。
你能从图像中心剪出一个边长 400 像素的正方形吗？
裁剪这张照片，使其聚焦于从左上角 (0,0) 到右下角 (600,400) 的矩形定义的区域。
我想在中间隔离主体，以中心周围 200 像素为半径裁剪图像。

图像旋转

图像旋转就是围绕给定中心点将图像旋转指定角度。旋转可以是顺时针或逆时针。在旋转过程中，图像的像素值会重新排列以适应新的方向，同时保留内容。旋转中心可以由图像中的特定点或图像的中心来定义。

Prompt举例：

将图像顺时针旋转 90 度。
请将给定图像逆时针旋转 45 度。
你能把图片绕中心旋转180度吗？
将此图像绕点 (300,300) 顺时针旋转 30 度。
我需要该图像即沿水平轴旋转 180 度。

图像模糊

图像模糊是一种用于减少噪声并平滑图像细节的技术。模糊是通过平均或操纵每个像素周围邻域中的像素值来实现的。可以指定常见的模糊技术包括高斯模糊（使用高斯分布应用加权平均值）和中值模糊（将每个像素替换为其邻域的中值）。

Prompt举例：

对图像应用半径为 5 像素的高斯模糊。
使用具有 3×3 内核的中值滤波器模糊此图像。
你能使用高斯方法对西格玛为 2.0 的图像应用模糊效果吗？
请在水平方向对图像应用运动模糊，内核大小为 20。
我想柔化这张照片中的细节，你可以应用模糊滤镜吗？

我的总结

现在Code Interpreter处理图像的功能还是挺有限，它内置的处理图像的Python库并不是全部，只是选了其中的一部分。但随着它内置更多的Python库，功能一定会更强大。

ChatGPT

用 ChatGPT Link Reader 插件搜索网页，处理在线文档和图片

ByVito 2023年11月13日2023年11月13日

在数字时代，我们不断受到来自互联网各个角落的信息轰炸。但我们该如何理解这一切？我们如何从海量数据中提取精华，翻译复杂的概念，甚至理解图片或视频的内容？在本文中，我们将探讨 Link Reader ChatGPT 插件，这是一款强大的工具。它使用自然语言处理技术来解释和总结从网页、PDF 到图片和视频等各种在线内容。在本文中，我们将用实际案例深入探讨 Link Reader ChatGPT 插件的功能和用法。让我们开始吧。功能 Link Reader ChatGPT 插件是一款功能极其丰富的工具。它使用户能够轻松处理、理解各种在线资源的内容并与之交互。它有强大的自然语言处理能力，可以解释和总结网页、PDF、PPT、图像、视频等内容，只要它们是在线的。它的主要功能包括内容提取、翻译、OCR 文本解析、视频转录分析等。具体来说，它有以下功能：使用使用Link Reader ChatGPT 插件有两个前提：接下来我们通过真实的案例来深度了解下如何使用这个插件。使用案例网页搜索并整理信息在当今的数字时代，我们触手可及的信息量令人难以承受。无论我们是购买新产品、调研产品市场还是了解当天的新闻，筛选搜索结果页面并组织成易于消化的内容都是一项耗时的任务。这就是Link Reader插件可以发挥作用的地方。凭借其内容处理、网络搜索和摘要功能的独特组合，你可以快速收集、理解和比较来自网络的各种信息。让我们来看一个使用案例。最近我想要从多个网站快速了解iPhone14的各种关键功能，于是我激活了这个插件并提交了以下魔法词：搜索有关 Apple iPhone 14 的信息。总结来自不同评论和新闻文章的关于该手机的规格，重点关注相机质量、电池寿命、处理能力和显示质量等方面，把收集的信息做成一个表格。 2分钟以后，ChatGPT就按照我的要求搜索了网页，汇总了信息并生成了表格：资料来源相机质量电池续航时间处理能力显示屏质量福布斯 iPhone 14 配备双 1200 万像素摄像头系统，可拍摄出令人惊叹的照片和视频。夜景模式经过改进，可提供更好的弱光拍摄效果。电池续航时间令人印象深刻，可正常使用一整天。 A16 Bionic 芯片大幅提升了性能，使 iPhone 14…

ChatGPT

开源免费：可以联网的 ChatGPT 代码解释器 Open Interpreter 本机安装教程

ByVito 2023年11月13日2023年11月13日

OpenAI 针对付费用户推出的代码解释器让很多不懂代码的人瞬间成为了专业的数据分析师。后来，OpenAI 干脆把这个晦涩的名字改为高级数据分析 (Advanced Data Analysis)。这个名字虽然直观，但毫无特色，所以本文还是称之为代码解释器。代码解释器的强大能力让很多人将其视为 GPT-4.5。当你要分析表格里的数据时，只需要用人类的语言告诉 ChatGPT 你想要分析什么，然后代码解释器就会变成你的专属程序员，帮你写 Python 代码分析数据。除此之外，它还能执行很多任务，比如批量处理文档，图片，视频等。尽管如此，它还是有很多限制。比如你必须要把文件上传到 ChatGPT。这一点有时候非常尴尬。比如当你想要对某个文件夹里的文件批量重命名时，你还要把文件上传到 ChatGPT，等 ChatGPT 写了一堆代码完成了重命名之后，你还再把文件下载下来。今天我要介绍一个完全免费的开源项目—Open Interpreter，它可以让你在本地运行代码解释器，直接打开终端就可以交互。项目介绍借助大语言模型，Open Interpreter 可在本地运行代码（Python、Javascript、Shell 等），帮你执行各种任务。它可以在本机调用 GPT-4, GPT-3.5，或者开源免费的 CodeLlama 模型。安装以后，每次只要打开终端，输入 “interpreter” 这个命令以后，就可以打开类似于 ChatGPT 的聊天界面。总的来说，它是代码解释器的平替，最强大的功能就是数据分析。我在之前的文章里有详细介绍。 [link] 所不同的是，它并不像代码解释器那样是一个封闭的环境。它可以联网，也可以和本地文件交互，因此你不需要上传文件进行分析。而且，如果在分析过程中如果它缺少某些 Python 库，可以联网自行下载。此外，代码解释器对于上传文件的大小是有限制的，但 Open Interpreter 却可以和你电脑上任意大的文件进行交互。因此，它对于处理文件非常方便。比如我在之前文章里[link]介绍过它可以批量处理文档，比如：它还可以批量操作图片，比如：除了本地运行之外，还可以在 Google Colab 上访问，上面还有许多现成的使用案例，地址是 https://colab.research.google.com/drive/1WKmRXZgsErej2xUriKzxrEAXdxMSgWbb。安装说明使用案例我让 Open Interpreter 执行这样一个任务：给文件夹里所有的…

ChatGPT

ChatGPT 代码解释器让人人都是数据分析师

ByVito 2023年11月13日2023年11月13日

OpenAI终于开放Code Interpreter给所有Plus用户使用了，这是一个天大的好消息，我迫不及待就开始了测试，测试结果也是喜出望外。由于Python代码的加持，能发挥Code Interpreter最大能力的领域就是数据分析了。普通的Excel数据分析根本不在话下，专业的数据分析也可以通过跟ChatGPT对话来进行，彻底改变了数据分析的方式。为了充分展示Code Interpreter的能力，我特地从Kaggle上找了一个数据集，并交给它一系列从简单的数据分析并生成图表到复杂的机器学习建模任务，由浅入深的探索了Code Interpreter的能力。不管你日常使用Excel进行数据分析，还是用Python代码，都能从这个案例知道如何使用Code Interpreter以及它的能力。这个数据集是关于奈飞 (Netflix) 8000多部电影和电视的数据，包括导演，演员，评级，发布时间，观看时间，节目类型，节目描述等数据。我会首先介绍如何安装Code Interpreter，然后一步步让它完成从简单到复杂的数据分析任务。最后，我对Code Interpreter对数据分析领域的影响和它本身的限制做了一个总结。如何安装Code Interpreter 目前ChatGPT的代码解释器 (Code Interpreter)的使用前提是要有ChatGPT Plus账号。登录ChatGPT以后，点击左下角用户名右边的三个点形状的按钮，打开ChatGPT的设置窗口。在新打开的窗口中，点击左侧的”Beta features”，然后把右侧下方的Code interpreter切换到打开状态。关闭窗口，把鼠标悬停在ChatGPT主界面上方的”GPT-4″按钮上，然后在弹出的下拉菜单里选择”Code interpreter”。这样我们就成功激活了Code interpreter。数据清理和预处理 ChatGPT的一个缺陷是无法直接上传文件，必须要通过网页连接或者第三方插件才能读取文件。然而有了代码解释器 (Code Interpreter)，你可以直接上传数据文件了。它支持512M以内的文件上传，并且上传前还可以解压缩。这个大小对于数据分析来说很足够了，你可以上传一个几百万行的csv文件。激活了Code Interpreter以后，聊天输入框内的左边会出现一个加号，点击它就可以打开本地电脑的文件浏览器了。我直接把从Kaggle上下载的解压包上传，省的再解压缩了。上传以后，我就直接开始给它任务了：作为一个专业的数据分析员，请遵循标准的数据分析程序。让我们一步一步来。 ChatGPT在进行初步的数据分析之后，给出的回复是这样的：如果你点击ChatGPT的回复里面的”Show Work”按钮，就会展开如下代码： Code Interpreter不仅为我们分析了数据，展示了分析过程，同时还输出了代码。对于会Python代码的同学来说，会更加清楚Code Interpreter进行数据分析的底层逻辑。不懂代码也没关系，Code Interpreter为每一行都添加了注释。通过以上代码和注释，你会发现ChatGPT其实在解压缩文件这个环节也是用了Python的os和zipfile库。我们其实并未让它解压缩，一切都是自动运行的。接下来它读取了各列的名称，并用它的理解对各个列名进行了诠释。这也是用ChatGPT分析数据的一大优势—它知道什么是奈飞，电影和电视这些话题，所以能够帮我们比较准确的解读数据。接下来它把每一列的缺失数据的总和都列举出来，并且根据缺失值的数量和分析的目标，给了处理这些缺失值的建议。因为如果有空数据的话，分析起来可能会报错，不合理的数据也会干扰分析的结果，所以数据的清洗通常是数据分析过程中一个非常重要的环节。因为ChatGPT存在随机性，有时它可能不会给出数据清洗的建议，这时候你可以主动要求它给出数据清洗的建议。也可以跳过这一步，后续遇到问题它会自行清理，谁叫它是机器呢，不嫌麻烦。但是为了减少碳足迹，我们就让按照它给出的建议清洗数据吧。于是我给了它这样一个Prompt: 将导演、演员和国家的缺失值填写为 “未知”，并删除添加日期、评级和观看时间的缺失值的行。 ChatGPT是这样回复的：所有缺失值都已成功处理。该数据集不再包含任何缺失值。现在我们可以进入下一个步骤：探索性数据分析（EDA）。在这一步，我们将深入研究数据集，了解数据的分布，不同变量之间的关系，并确定任何有趣的模式或见解。你想在这个数据集中探索哪些具体方面？例如，我们可以看看电影与电视节目的分布，分析多年来增加的内容，或者看看哪些国家生产的内容最多，等等。探索性数据分析…

ChatGPT

人人都可创建自己的GPT啦！来看怎么弄

ByVito 2023年11月14日2024年1月10日

OpenAI 前两天的 AI “春晚” 像极了苹果发布会，GPT Store 从此成为 AI 界的应用商店。比苹果应用商店更强大的是，创建一个 GPT 仅需要几分钟，而且无需代码！你可以创建自己的 GPT 来提高生产力，也可以发布到应用商店里赚钱。如果还不是 Plus 用户的话，赶紧升级一下吧！我将创建一个 GPT 给大家演示怎么操作。这个 GPT 的功能是可以生成中英对照的诗词，还自动配封面图。我给 GPT 喂了一本翻译家许渊冲老师翻译的中英诗词集，让中文和英文诗更加地道。效果如下：进入创建页面进入创建 GPT 的页面有两种方式：一种是点击左边菜单栏的 “Explore (发现)”，然后在 My GPTs (我的GPT) 标题的下方找到 “Create a GPT (创建一个GPT)” ，接着点击进入。还一种是直接在浏览器输入 “chat.openai.com/gpts/editor”。基础介绍创建的页面分为左右两个部分。左边用来定义 GPT，右边用来预览效果。创建 GPT 的过程其实很简单，就是和 ChatGPT 一起填一个表格。点击 “Configure (配置)” 按钮就可以看见这个表格，见下图。看起来项目很多，有些复杂。然而，当你点击 “Create” 按钮时，就可以和 ChatGPT…

ChatGPT

11 个非常简短却非常神奇的 ChatGPT 指令，刷新你的认知

ByVito 2023年11月13日2023年11月13日

人工智能日益成为我们工作和生活的一部分。ChatGPT 作为人工智能的代表性工具，它的有效性取决于人们使用它的程度，这也是提示词工程 (Prompt Engineering) 发挥作用的地方。提示词工程是指精心设计有针对性的问题或陈述，以从 ChatGPT 等语言模型中提取最有用、最准确和最全面的信息。尽管 ChatGPT 的设计可以理解和响应各种查询，但如果你知道如何以正确的方式提出正确的问题，回答的质量就会大大提高。本文将介绍 11 个短小精悍的提示词，让你很容易记忆并应用它们。(PS: 在跟 ChatGPT 对话时，我大多数情况下都用英语，因为这样能生成更好的回答。英语吃不消的时候，我会用 DeepL 翻译一下。当然，本文介绍中文提示词也同样有效。） 1. Let’s Think Step by Step (让我们逐步思考) ChatGPT 和人脑的结构是不同的，它并没有人类的逻辑能力。我在之前的文章里介绍了 ChatGPT 非常强大的数学能力，它甚至能解决微积分问题。它的 “推理能力” 源于思维链技术。这种技术引导 ChatGPT 将复杂问题分解为较小的，它可以轻松处理的部分，最后将这些部分连接起来，形成一个连贯的见解。而这个神奇的提示词可以帮助 ChatGPT 把问题拆分成更小的部分从而提升解决问题的能力。来看一个例子，我问 ChatGPT 这样一个问题：在 “AI is not a replacement for human intelligence.” 这个句子当中，第 5 个单词是什么？它竟然告诉我是 “not”。其实并不是它笨，而是 ChatGPT 这样的大语言模型不像人类那样来把句子分解为一个个单词的。它是按照 Token…

ChatGPT

如何在 ChatGPT 中使用二八定律 (帕累托法则)

ByVito 2023年11月13日2023年11月13日

生活中我们经常会发现这样一个规律：20%的因素影响80%的结果。比如说，一家公司大约 80% 的营业额来源于 20% 的客户，全球最富有的 20% 的人口掌握大约 80% 的财富。这个规律就是著名的二八定律，它是意大利经济学家帕累托发现的，因此又称帕累托法则。很多人整天忙忙碌碌，但最终却并未取得什么成就，很可能就是因为没有抓住那关键的 20%，而是把时间和精力浪费在很多低价值的事务上。二八定律可以帮助我们确定应该将精力集中在哪些领域，从而实现资源的高效配置。 ChatGPT 不仅理解二八定律，而且具有各行各业的广泛知识。它从海量的信息中筛选出最重要的那 20%，帮助个人和组织更有效地集中精力。让我们通过提示词来看看二八定律在 ChatGPT 中的应用场景吧。解决问题了解问题的根本原因通常可以提供最有效的解决方案。在遇到问题时，可以使用以下提示词找到最关键的原因： Prompt: I’m facing a problem with [SPECIFIC PROBLEM/ISSUE]. What are the critical 20% factors that might be causing 80% of this issue? (我在[特定问题]方面遇到了问题。有哪些 20% 的关键因素可能导致 80% 的问题？) 为了让 ChatGPT 充分发挥解决问题的能力，最好能够详细阐述自己目前遇到的状况。比如说，我可以写这样一个提示词：我们来看看 ChatGPT 的回答：生产力在追求效率最大化的过程中，我们常常过于分散自己。ChatGPT 利用二八定律可以帮助我们识别并专注于关键的…

删除图像主题周围空白背景

图片转GIF动画

图片加水印

人脸识别

图像降噪

基础图像处理

图像缩放

图像裁剪

图像旋转

图像模糊

我的总结

Similar Posts

Leave a Reply Cancel reply