开源免费:可以联网的 ChatGPT 代码解释器 Open Interpreter 本机安装教程
OpenAI 针对付费用户推出的代码解释器让很多不懂代码的人瞬间成为了专业的数据分析师。后来,OpenAI 干脆把这个晦涩的名字改为高级数据分析 (Advanced Data Analysis)。这个名字虽然直观,但毫无特色,所以本文还是称之为代码解释器。
代码解释器的强大能力让很多人将其视为 GPT-4.5。当你要分析表格里的数据时,只需要用人类的语言告诉 ChatGPT 你想要分析什么,然后代码解释器就会变成你的专属程序员,帮你写 Python 代码分析数据。
除此之外,它还能执行很多任务,比如批量处理文档,图片,视频等。尽管如此,它还是有很多限制。比如你必须要把文件上传到 ChatGPT。这一点有时候非常尴尬。比如当你想要对某个文件夹里的文件批量重命名时,你还要把文件上传到 ChatGPT,等 ChatGPT 写了一堆代码完成了重命名之后,你还再把文件下载下来。
今天我要介绍一个完全免费的开源项目—Open Interpreter,它可以让你在本地运行代码解释器,直接打开终端就可以交互。
项目介绍
借助大语言模型,Open Interpreter 可在本地运行代码(Python、Javascript、Shell 等),帮你执行各种任务。
它可以在本机调用 GPT-4, GPT-3.5,或者开源免费的 CodeLlama 模型。
安装以后,每次只要打开终端,输入 “interpreter” 这个命令以后,就可以打开类似于 ChatGPT 的聊天界面。
总的来说,它是代码解释器的平替,最强大的功能就是数据分析。我在之前的文章里有详细介绍。 [link] 所不同的是,它并不像代码解释器那样是一个封闭的环境。它可以联网,也可以和本地文件交互,因此你不需要上传文件进行分析。而且,如果在分析过程中如果它缺少某些 Python 库,可以联网自行下载。
此外,代码解释器对于上传文件的大小是有限制的,但 Open Interpreter 却可以和你电脑上任意大的文件进行交互。因此,它对于处理文件非常方便。比如我在之前文章里[link]介绍过它可以批量处理文档,比如:
- PDF批量加水印
- 批量合并和拆分PDF
- 批量提取PDF里的表格和图片
- 批量为PDF设置密码保护
- 批量进行各种格式转化
它还可以批量操作图片,比如:
- 图片转GIF动画
- 图片加水印
- 人脸识别
- 图像降噪
除了本地运行之外,还可以在 Google Colab 上访问,上面还有许多现成的使用案例,地址是 https://colab.research.google.com/drive/1WKmRXZgsErej2xUriKzxrEAXdxMSgWbb。
安装说明
- 在安装之前,首先确保你的电脑上已经安装好了 Python 和 Git。然后打开终端,把项目文件克隆到你的电脑上。
- 接着进入项目的文件夹。
cd open-interpreter
- 然后使用
pip
进行安装。
pip install open-interpreter
- 安装好以后,输入
interpreter
进入交互页面。
interpreter
- 如果你要使用 GPT-4 (推荐) 或者 GPT-3.5-Turbo, 把你的 OpenAI API 密钥复制粘贴到终端里。你还可以根据提示把密钥设置为环境变量。
- 由于代码会直接和你电脑里的文件发生交互,因此为了安全起见,Open Interpreter 在执行代码时会让你确认。你在运行过程中发现安全问题也可以随时关闭终端。如果你不想一直确认,也可以输入
interpreter -y
或者interpreter.auto_run = True
绕过这些确认的步骤。
- 默认使用的时 GPT-4,如果你像用
gpt-3.5-turbo
,可以输入interpreter --fast
。或者,在 Python 环境中,你可以输入interpreter.model = "gpt-3.5-turbo"
。 - 如果你没有输入 API Key,那么 Open Interpreter 会切换到 Code-Llama。如果你没有安装过的话,它会首先让你选择不同的版本。根据大小和质量,你有以下选择:
- 如果你的网络环境不稳定,还可以把模型下载到本地,然后放到这个文件夹里
"C:\Users\<你的用户名>\AppData\Local\Open Interpreter\Open Interpreter\models"
。 - 安装好以后,下次你要运行 Code-Llama,可以直接输入
interpreter --local
。
使用案例
我让 Open Interpreter 执行这样一个任务:给文件夹里所有的 PDF 文件 加上水印。Prompt 如下:
Please add a diagonal watermark to the center of each page in multiple PDFs found in the folder (“C:\Users\Vito\Downloads\lorem_ipsum_pdfs”). The watermark should be scaled to 75% of the target page size. The content of the watermark should be “credential” written in Courier-Bold font, gray color, with 50% opacity.
经过它不断调试,最终完成了这个任务。虽然完成这个任务需要安装很多 Python 库,但和代码解释器不同,安装好的库已经在本地电脑上了,下次无需安装。
最终安装我的要求加上了水印。
鉴于 GPT-4 API 高昂的价格,执行简单任务时可以尝试 gpt-3.5-turbo
。比如我让它帮我写一篇关于大语言模型的文章,然后保存为 Markdown 文件。
当我打开 Typora 时,就看到了它写的文章。
以上是我的一些简单体验,更高级的玩法可以参考刚才提到过的 Google Colab 笔记。