4种方法让你上传任何文件到ChatGPT: 总有一种适合你

在不断发展的数字世界中,处理、交互和管理各种文件格式的能力变得越来越重要。 无论您是 ChatGPT 免费用户还是 ChatGPT Plus 会员,本文介绍的4个方法都可以彻底改变您处理文档的方式。 你从此可以将任何类型的文档上传到 ChatGPT——无论是简单的 PDF、Excel 工作表、图像还是音频文件。

谷歌浏览器插件ChatGPT File Uploader Extended

无论你是ChatGPT免费用户还是ChatGPT Plus用户,都可以通过安装谷歌浏览器插件ChatGPT File Uploader Extended来实现ChatGPT文件上传。

安装好插件以后,只需要点击一个按钮,就可以轻松上传PDF,Word或者Excel电子表格。

你甚至还可以上传图片。这个插件都可以智能识别文档或图片里的内容并提取出来交给ChatGPT。

这个插件一共支持35种文件格式:.txt, .js, .py, .html, .cs, .java, .go, .php, .xml, .yml, .yaml, .toml, .ini, .cfg, .conf, .sh, .bat, .css, .json, .csv, .md, .ts, .tsx, .jsx, .pdf, .doc, .docx, .xls, xlsx, .zip, .png, .jpg, .jpeg, .bmp, .webp.

如果你有一大堆文档和图片需要上传,也不必担心,只需要把它们放在一个压缩包里,这个插件就可以自动解压并把文件依次上传。很方便吧!

上传文件以后,你不必担心ChatGPT提示你超过Token限制,因为它会自动把长文本分成很多部分,然后依次提交给ChatGPT。提交结束以后,它还会帮你自动总结上传的文本内容。

安装这个插件只需要两步。第一步,访问下面的网址

https://chrome.google.com/webstore/detail/chatgpt-file-uploader-ext/becfinhbfclcgokjlobojlnldbfillpf?hl=en-US
install chrome extension chatgpt file uploader extended

第二部,点击”Add to Chrome”按钮,然后ChatGPT File Uploader Extended就被添加到你的插件列表里了。

当你再次刷新ChatGPT的时候,你就会发现ChatGPT的聊天输入框下面多了一个”Upload File”按钮。为了照顾所有ChatGPT用户,我用GPT-3.5做的演示,虽然我用的是Plus账号。

upload files to chatgpt with chrome extension chatgpt file uploader extended

点击这个按钮,会打开本机的文件浏览器,选择你要上传的文件就好了。接下来,这个插件会识别并提取你上传的文件里的文本,然后根据预设的文本块的字符数,把文本分成若干个部分,然后依次提交给ChatGPT。

如下图所示,系统默认的文本块的字符数 (Chunk Size)是2000个字符。这个插件把我上传的文件里的文本分成7个部分依次上传。上传过程会显示进度条,也可以点击“Stop Upload”停止上传。

chrome extension chatgpt file uploader extended uploading file process

我上传了一个名为”Improved Performance of ChatGPT-4 on the OKAP Exam”的PDF文档,这个插件把所有文本内容提交给ChatGPT后,自动总结了该PDF的内容,并告诉我接下去还可以问ChatGPT任何问题。

chrome extension chatgpt file uploader extended summarize text

文本块的字符数 (Chunk Size)是可以自定义的。要打开ChatGPT File Uploader Extended的设置页面,只需要点击”Upload File”按钮左边的齿轮按钮。

chrome extension chatgpt file uploader extended setting

点击该按钮之后,就打开了设置页面。然后找到“Chunk Size”下方的文本输入框,填入你想设置的大小就可以了。

chrome extension chatgpt file uploader extended setting page

AskYourPDF

AskYourPDF是一个基于GPT的多语言文档主力,可以帮用户阅读PDF的网站。有了它,你无需再阅读冗长的PDF,可以让ChatGPT帮你轻松查询、总结和提取PDF文档中的信息。你可以让它

  • 总计整个文档或其中的特定部分
  • 提取要点、结论、统计数据和参考文献
  • 搜索文档中的关键字、数据、表格或图像
  • 询问有关特定页面和内容的问题

你可以通过两种方式让ChatGPT分析PDF文档:

选项一:上传本地PDF

如果你是ChatGPT免费用户的话,不需要登录ChatGPT,通过访问AskYourPDF的官网并上传本地PDF文档。

首先,在浏览器中输入这个URL:www.askyourpdf.com

askyourpdf chatgpt plugin website interface

然后点击写着”Upload Document Here”的虚线框打开本机的文件浏览器,或者直接把PDF从本机的文件浏览器拖入虚线框。

文档上传以后,它就直接总结了文档的内容并生成了一些你可能会问它的问题:

您好,我是一名多语言文档助理。 如果您对上传的文档有任何疑问,我将随时为您提供帮助。 该文档是关于聊天生成预训练变压器(ChatGPT)的,这是一种人工智能驱动的聊天机器人,可以生成类似人类的句子并撰写连贯的文章。 它讨论了 ChatGPT 背后的历史和技术、其在各个领域的潜在应用、围绕 ChatGPT 的隐私和道德问题以及当前版本的局限性。 该论文还包括与 ChatGPT 的对话,其中提供了自己的观点并回答了几个问题

以下是您可能会遇到的三个问题

  1. ChatGPT在医疗保健、教育和研究方面的潜在应用是什么
  2. ChatGPT 的隐私和道德问题是什么
  3. ChatGPT当前版本有哪些限制

如果您对该文档有任何疑问,请随时向我询问。

接下来你可以直接在AskYourPDF的网站上继续询问关于该PDF的任何问题。你还可以点击”Export Chat as PDF”把你和AskYourPDF的对话导出为PDF文档。或者点击分享按钮把你的PDF文档的分享给他人。任何获取该链接的人都可以开始一个新的对话。

askyourpdf share to social media

通过AskYourPDF官网跟PDF文档对话,应该用的是GPT-3.5.

如果你是ChatGPT Plus用户,最好安装AskYourPDF插件,用GPT-4跟PDF对话。

要使用这个插件,首先确保已经激活了ChatGPT插件的功能。

chatgpt user interface
open chatgpt setting
chatgpt plugin setting beta features

然后去ChatGPT插件商店搜索插件进行安装。

head to chatgpt plugin store

然后搜索关键词”askyourpdf”并点击”Install“进行安装。

install askyourpdf chatgpt plugin

确保AskYourPDF处于被选中状态。

askyourpdf chatgpt plugin selected

然后,你可以输入以下Prompt:

上传PDF

然后,ChatGPT就会在回复里给你一个上传文档的链接。

askyourpdf chatgpt plugin document upload url

点击该链接访问AskYourPDF官网并上传文档以后,AskYourPDF就会给你一个文档ID。

askyourpdf chatgpt plugin document id

复制该ID就可以在ChatGPT里使用了。把这个ID提交给ChatGPT它就能够获取PDF的内容。

然后回到ChatGPT的界面,像往常一样输入你的Prompt或者问题,把刚才的文档ID粘贴到后面就好了。

askyourpdf chatgpt plugin summarize pdf

选项二:使用URL

如果你是ChatGPT Plus用户,激活了AskYourPDF插件,可以通过提交在线PDF的可以公开访问的URL来跟PDF文档聊天。

按照以下步骤操作:

  1. 像往常一样在ChatGPT对话框中输入Prompt或问题。
  2. 输入Prompt或问题之后,在后面把完整的URL直接粘贴到ChatGPT对话框中。
  3. 按Enter或者单击“Send message”按钮。
  4. ChatGPT 将获取PDF内容并利用 AskYourPDF 插件来回答你的问题。

例如我输入以下Prompt:

这是一篇研究论文:https://arxiv.org/ftp/arxiv/papers/2302/2302.13817.pdf。 请总结主要发现。

summarize research paper using askyourpdf chatgpt plugin by submitting url

ChatGPT代码解释器

ChatGPT的代码解释器是ChatGPT Plus用户自带的一项功能。它是OpenAI开发的一个令人惊叹的工具,可以让你轻松对多个文档执行批处理和转换。无论你要从文件里提取文本,表格或图片,还是要合并或分割PDF,转换文件格式,只需要给ChatGPT提交一个简单的Prompt,Code Interpreter就可以帮你快速完成这些任务。

它有很多关于处理文档的使用案例:

  • PDF批量加水印
  • 合并和拆分PDF
  • 提取PDF里的表格和图片
  • 密码保护PDF
  • 总结PDF内容
  • 为PDF生成词云
  • 从PDF中提取信息
  • OCR识别
  • 各种文件格式之间批量转换

这些任务是上面的谷歌浏览器插件所无法完成的。我在之前的这篇文章里有详细介绍:

👉 1分钟处理1000个文档:ChatGPT代码解释器就是这么牛

它支持非常多的文件格式,包括:

  • 压缩: 7Z、TAR、ZIP、RAR、GZ、BZ2、XZ、LZMA
  • 音频: MP3、WAV、FLAC、AAC、OGG、M4A、AIFF、WMA、AMR
  • 文档: DOC、DOCX、PDF、RTF、HTML、TXT、ODT、EPUB、CSV、XLS、XLSX、PPT、PPTX、 Markdown、LaTeX
  • 表格: XLSX, CSV
  • 图像: PNG、JPG、JPEG、BMP、TIFF、GIF、SVG、ICO、WEBP、RAW、HEIC、EPS、PSD
  • 视频: MP4、AVI、MOV、FLV、MKV、WMV、3GP、WebM、MPEG、VOB
  • 代码文件: PY、JS、JAVA、C、CPP、CS、R、Swift、PHP、Ruby、Go、Kotlin、Lua、Shell
  • 数据文件: JSON、XML、YAML、SQL、HDF5、PICKLE、Parquet、Protobuf
  • 字幕: SRT、ASS、SSA、VTT
  • 字体: TTF、OTF、WOFF、EOT
  • 3D 文件: STL、OBJ、FBX、COLLADA、3DS、IGES、STEP
  • 地理空间数据: GeoJSON、SHP、KML、GPX、GeoTIFF
  • 科学数据格式: FITS、VTK、NetCDF、DICOM
  • CAD 文件: DWG、DXF
  • 电子书: EPUB、MOBI、AZW3
  • 电子邮件: EML、MSG
  • 网络: HTML、CSS、JS、WebAssembly
  • 其他: LOG

它最大的用处就是上传数据文件,比如CSV或Excel文件并进行数据分析和可视化

要使用代码解释器,首先确保你已经激活了它。登录ChatGPT以后,点击左下角用户名右边的三个点形状的按钮,打开ChatGPT的设置窗口。

chatgpt setting button
chatgpt setting

在新打开的窗口中,点击左侧的”Beta features”,然后把右侧下方的Code interpreter切换到打开状态。

project 10 chatgpt beta features code interpreter

关闭窗口,把鼠标悬停在ChatGPT主界面上方的”GPT-4″按钮上,然后在弹出的下拉菜单里选择”Code interpreter”。

activate chatgpt code interpreter

这样我们就成功激活了Code interpreter。

chatgpt main interface with code interpreter

激活了代码解释器 (Code Interpreter),你可以直接上传数据文件了。你会看到聊天输入框内的左边出现了一个加号,点击它就可以打开本地电脑的文件浏览器了。

chatgpt code interpreter upload file button

如果你有多个文件要上传的话,最好把它先放在一个文件夹里然后压缩以后再上传,这样上传起来比较快。

Quivr

Quivr和以上的工具都不同,你不仅把各种文件(文档、图片、网站、音频、视频等)上传到Quivr,而且让Quivr长期保存这些文件,并利用生成式人工智能技术成为你的第二大脑。

它是一个开源的Github项目,技术小白们可以直接使用它的网站服务把各种文件上传到云端。开发者可以本地或服务器部署,根据自己的需求自定义各种功能,将它与其他工具相集成,并利用开源社区添加新的功能。

你在GPT等大型语言模型的支持下提出问题、获取摘要、生成新内容等等。

使用它也非常简单。

首先,访问quivr.app,创建一个账户并登录。

quivr login page

登录账户以后,点击菜单栏的“Upload”,就可以上传文件了。

quivr file upload

上传好了文件,点击菜单栏的Chat,进入到AI聊天的界面。因为Quivr网页版的App是调用OpenAI的API提供智能答案,文档摘要等功能,所以在聊天之前要配置一下OpenAI的API密钥。

访问OpenAI官网:https://platform.openai.com/account/api-keys,点击”Create new secret key”来创建一个新的密钥。

create openai api key

把新创建的API密钥复制一下。这个密钥一定要妥善保存,千万不要告诉别人哦。

然后回到Quivr的聊天界面,点击”Chat”按钮右边的齿轮按钮打开Quivr的设置界面。

quivr chat setting button

把刚才复制的密钥粘贴到“Open AI Key”下方的文本框里。

quivr api configuration

点击”Model”下方的下拉菜单,选择一个GPT模型。注意GPT-4比GPT-3.5要贵很多,酌情使用哦。选择好模型,然后再点击“Done”按钮,就完成基本的配置啦。

quivr openai model selection

配置好以后,就可以开始聊天啦。因为我刚才上传的PDF文档是关于ChatGPT-4的,所以我问了以下问题:

ChatGPT-4在眼科教育和临床决策支持系统中的潜在应用是什么

Quivr很快给出了回答。

quivr conversation

结语

总之,人工智能的到来彻底改变了我们与文件交互的方式,使曾经费力的任务变得轻而易举。 这一浪潮会重塑我们的日常活动、简化我们的工作并提高我们的工作效率。 我们与信息的互动不再是被动的,而是深度参与和直观的。让我们行动起来,利用人工智能释放数字文档的真正潜力。

类似文章

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注