4种方法让你上传任何文件到ChatGPT: 总有一种适合你
在不断发展的数字世界中,处理、交互和管理各种文件格式的能力变得越来越重要。 无论您是 ChatGPT 免费用户还是 ChatGPT Plus 会员,本文介绍的4个方法都可以彻底改变您处理文档的方式。 你从此可以将任何类型的文档上传到 ChatGPT——无论是简单的 PDF、Excel 工作表、图像还是音频文件。
谷歌浏览器插件ChatGPT File Uploader Extended
无论你是ChatGPT免费用户还是ChatGPT Plus用户,都可以通过安装谷歌浏览器插件ChatGPT File Uploader Extended来实现ChatGPT文件上传。
安装好插件以后,只需要点击一个按钮,就可以轻松上传PDF,Word或者Excel电子表格。
你甚至还可以上传图片。这个插件都可以智能识别文档或图片里的内容并提取出来交给ChatGPT。
这个插件一共支持35种文件格式:.txt, .js, .py, .html, .cs, .java, .go, .php, .xml, .yml, .yaml, .toml, .ini, .cfg, .conf, .sh, .bat, .css, .json, .csv, .md, .ts, .tsx, .jsx, .pdf, .doc, .docx, .xls, xlsx, .zip, .png, .jpg, .jpeg, .bmp, .webp.
如果你有一大堆文档和图片需要上传,也不必担心,只需要把它们放在一个压缩包里,这个插件就可以自动解压并把文件依次上传。很方便吧!
上传文件以后,你不必担心ChatGPT提示你超过Token限制,因为它会自动把长文本分成很多部分,然后依次提交给ChatGPT。提交结束以后,它还会帮你自动总结上传的文本内容。
安装这个插件只需要两步。第一步,访问下面的网址
第二部,点击”Add to Chrome”按钮,然后ChatGPT File Uploader Extended就被添加到你的插件列表里了。
当你再次刷新ChatGPT的时候,你就会发现ChatGPT的聊天输入框下面多了一个”Upload File”按钮。为了照顾所有ChatGPT用户,我用GPT-3.5做的演示,虽然我用的是Plus账号。
点击这个按钮,会打开本机的文件浏览器,选择你要上传的文件就好了。接下来,这个插件会识别并提取你上传的文件里的文本,然后根据预设的文本块的字符数,把文本分成若干个部分,然后依次提交给ChatGPT。
如下图所示,系统默认的文本块的字符数 (Chunk Size)是2000个字符。这个插件把我上传的文件里的文本分成7个部分依次上传。上传过程会显示进度条,也可以点击“Stop Upload”停止上传。
我上传了一个名为”Improved Performance of ChatGPT-4 on the OKAP Exam”的PDF文档,这个插件把所有文本内容提交给ChatGPT后,自动总结了该PDF的内容,并告诉我接下去还可以问ChatGPT任何问题。
文本块的字符数 (Chunk Size)是可以自定义的。要打开ChatGPT File Uploader Extended的设置页面,只需要点击”Upload File”按钮左边的齿轮按钮。
点击该按钮之后,就打开了设置页面。然后找到“Chunk Size”下方的文本输入框,填入你想设置的大小就可以了。
AskYourPDF
AskYourPDF是一个基于GPT的多语言文档主力,可以帮用户阅读PDF的网站。有了它,你无需再阅读冗长的PDF,可以让ChatGPT帮你轻松查询、总结和提取PDF文档中的信息。你可以让它
- 总计整个文档或其中的特定部分
- 提取要点、结论、统计数据和参考文献
- 搜索文档中的关键字、数据、表格或图像
- 询问有关特定页面和内容的问题
你可以通过两种方式让ChatGPT分析PDF文档:
选项一:上传本地PDF
如果你是ChatGPT免费用户的话,不需要登录ChatGPT,通过访问AskYourPDF的官网并上传本地PDF文档。
首先,在浏览器中输入这个URL:www.askyourpdf.com。
然后点击写着”Upload Document Here”的虚线框打开本机的文件浏览器,或者直接把PDF从本机的文件浏览器拖入虚线框。
文档上传以后,它就直接总结了文档的内容并生成了一些你可能会问它的问题:
您好,我是一名多语言文档助理。 如果您对上传的文档有任何疑问,我将随时为您提供帮助。 该文档是关于聊天生成预训练变压器(ChatGPT)的,这是一种人工智能驱动的聊天机器人,可以生成类似人类的句子并撰写连贯的文章。 它讨论了 ChatGPT 背后的历史和技术、其在各个领域的潜在应用、围绕 ChatGPT 的隐私和道德问题以及当前版本的局限性。 该论文还包括与 ChatGPT 的对话,其中提供了自己的观点并回答了几个问题
以下是您可能会遇到的三个问题
- ChatGPT在医疗保健、教育和研究方面的潜在应用是什么
- ChatGPT 的隐私和道德问题是什么
- ChatGPT当前版本有哪些限制
如果您对该文档有任何疑问,请随时向我询问。
接下来你可以直接在AskYourPDF的网站上继续询问关于该PDF的任何问题。你还可以点击”Export Chat as PDF”把你和AskYourPDF的对话导出为PDF文档。或者点击分享按钮把你的PDF文档的分享给他人。任何获取该链接的人都可以开始一个新的对话。
通过AskYourPDF官网跟PDF文档对话,应该用的是GPT-3.5.
如果你是ChatGPT Plus用户,最好安装AskYourPDF插件,用GPT-4跟PDF对话。
要使用这个插件,首先确保已经激活了ChatGPT插件的功能。
然后去ChatGPT插件商店搜索插件进行安装。
然后搜索关键词”askyourpdf”并点击”Install“进行安装。
确保AskYourPDF处于被选中状态。
然后,你可以输入以下Prompt:
上传PDF
然后,ChatGPT就会在回复里给你一个上传文档的链接。
点击该链接访问AskYourPDF官网并上传文档以后,AskYourPDF就会给你一个文档ID。
复制该ID就可以在ChatGPT里使用了。把这个ID提交给ChatGPT它就能够获取PDF的内容。
然后回到ChatGPT的界面,像往常一样输入你的Prompt或者问题,把刚才的文档ID粘贴到后面就好了。
选项二:使用URL
如果你是ChatGPT Plus用户,激活了AskYourPDF插件,可以通过提交在线PDF的可以公开访问的URL来跟PDF文档聊天。
按照以下步骤操作:
- 像往常一样在ChatGPT对话框中输入Prompt或问题。
- 输入Prompt或问题之后,在后面把完整的URL直接粘贴到ChatGPT对话框中。
- 按Enter或者单击“Send message”按钮。
- ChatGPT 将获取PDF内容并利用 AskYourPDF 插件来回答你的问题。
例如我输入以下Prompt:
这是一篇研究论文:https://arxiv.org/ftp/arxiv/papers/2302/2302.13817.pdf。 请总结主要发现。
ChatGPT代码解释器
ChatGPT的代码解释器是ChatGPT Plus用户自带的一项功能。它是OpenAI开发的一个令人惊叹的工具,可以让你轻松对多个文档执行批处理和转换。无论你要从文件里提取文本,表格或图片,还是要合并或分割PDF,转换文件格式,只需要给ChatGPT提交一个简单的Prompt,Code Interpreter就可以帮你快速完成这些任务。
它有很多关于处理文档的使用案例:
- PDF批量加水印
- 合并和拆分PDF
- 提取PDF里的表格和图片
- 密码保护PDF
- 总结PDF内容
- 为PDF生成词云
- 从PDF中提取信息
- OCR识别
- 各种文件格式之间批量转换
这些任务是上面的谷歌浏览器插件所无法完成的。我在之前的这篇文章里有详细介绍:
👉 1分钟处理1000个文档:ChatGPT代码解释器就是这么牛
它支持非常多的文件格式,包括:
- 压缩: 7Z、TAR、ZIP、RAR、GZ、BZ2、XZ、LZMA
- 音频: MP3、WAV、FLAC、AAC、OGG、M4A、AIFF、WMA、AMR
- 文档: DOC、DOCX、PDF、RTF、HTML、TXT、ODT、EPUB、CSV、XLS、XLSX、PPT、PPTX、 Markdown、LaTeX
- 表格: XLSX, CSV
- 图像: PNG、JPG、JPEG、BMP、TIFF、GIF、SVG、ICO、WEBP、RAW、HEIC、EPS、PSD
- 视频: MP4、AVI、MOV、FLV、MKV、WMV、3GP、WebM、MPEG、VOB
- 代码文件: PY、JS、JAVA、C、CPP、CS、R、Swift、PHP、Ruby、Go、Kotlin、Lua、Shell
- 数据文件: JSON、XML、YAML、SQL、HDF5、PICKLE、Parquet、Protobuf
- 字幕: SRT、ASS、SSA、VTT
- 字体: TTF、OTF、WOFF、EOT
- 3D 文件: STL、OBJ、FBX、COLLADA、3DS、IGES、STEP
- 地理空间数据: GeoJSON、SHP、KML、GPX、GeoTIFF
- 科学数据格式: FITS、VTK、NetCDF、DICOM
- CAD 文件: DWG、DXF
- 电子书: EPUB、MOBI、AZW3
- 电子邮件: EML、MSG
- 网络: HTML、CSS、JS、WebAssembly
- 其他: LOG
它最大的用处就是上传数据文件,比如CSV或Excel文件并进行数据分析和可视化。
要使用代码解释器,首先确保你已经激活了它。登录ChatGPT以后,点击左下角用户名右边的三个点形状的按钮,打开ChatGPT的设置窗口。
在新打开的窗口中,点击左侧的”Beta features”,然后把右侧下方的Code interpreter切换到打开状态。
关闭窗口,把鼠标悬停在ChatGPT主界面上方的”GPT-4″按钮上,然后在弹出的下拉菜单里选择”Code interpreter”。
这样我们就成功激活了Code interpreter。
激活了代码解释器 (Code Interpreter),你可以直接上传数据文件了。你会看到聊天输入框内的左边出现了一个加号,点击它就可以打开本地电脑的文件浏览器了。
如果你有多个文件要上传的话,最好把它先放在一个文件夹里然后压缩以后再上传,这样上传起来比较快。
Quivr
Quivr和以上的工具都不同,你不仅把各种文件(文档、图片、网站、音频、视频等)上传到Quivr,而且让Quivr长期保存这些文件,并利用生成式人工智能技术成为你的第二大脑。
它是一个开源的Github项目,技术小白们可以直接使用它的网站服务把各种文件上传到云端。开发者可以本地或服务器部署,根据自己的需求自定义各种功能,将它与其他工具相集成,并利用开源社区添加新的功能。
你在GPT等大型语言模型的支持下提出问题、获取摘要、生成新内容等等。
使用它也非常简单。
首先,访问quivr.app,创建一个账户并登录。
登录账户以后,点击菜单栏的“Upload”,就可以上传文件了。
上传好了文件,点击菜单栏的Chat,进入到AI聊天的界面。因为Quivr网页版的App是调用OpenAI的API提供智能答案,文档摘要等功能,所以在聊天之前要配置一下OpenAI的API密钥。
访问OpenAI官网:https://platform.openai.com/account/api-keys,点击”Create new secret key”来创建一个新的密钥。
把新创建的API密钥复制一下。这个密钥一定要妥善保存,千万不要告诉别人哦。
然后回到Quivr的聊天界面,点击”Chat”按钮右边的齿轮按钮打开Quivr的设置界面。
把刚才复制的密钥粘贴到“Open AI Key”下方的文本框里。
点击”Model”下方的下拉菜单,选择一个GPT模型。注意GPT-4比GPT-3.5要贵很多,酌情使用哦。选择好模型,然后再点击“Done”按钮,就完成基本的配置啦。
配置好以后,就可以开始聊天啦。因为我刚才上传的PDF文档是关于ChatGPT-4的,所以我问了以下问题:
ChatGPT-4在眼科教育和临床决策支持系统中的潜在应用是什么
Quivr很快给出了回答。
结语
总之,人工智能的到来彻底改变了我们与文件交互的方式,使曾经费力的任务变得轻而易举。 这一浪潮会重塑我们的日常活动、简化我们的工作并提高我们的工作效率。 我们与信息的互动不再是被动的,而是深度参与和直观的。让我们行动起来,利用人工智能释放数字文档的真正潜力。