unique features of gemini pro

我发现谷歌 Gemini Pro 的这 8 个功能连 GPT-4 都自愧不如

谷歌的聊天机器人 Bard 已经发布很久了,但我始终都没当回事儿,当然也很少用它。直到前两天,谷歌和 DeepMind 合作的大模型 Gemini Pro 被植入 Bard,一时间竟有碾压 GPT-4 之势。

我在之前的文章中对 Gemini Pro 和 GPT-4 进行了深度比较。

👉 谷歌 Gemini 吊打 GPT-4?来看我的深度测评

Gemini Pro 在很多方面和 GPT-4 存在较大差距。然而,作为一个对标 GPT-3.5 的产品来说,已然成功了。它本身就是一个多模态的大模型,可以联网,也可以识图,和 GPT-3.5 没有可比性。

如果还没有体验过,可以访问 bard.google.com。确保谷歌账户的国家和 IP 是米国,语言是英语。如果你访问它的更新日志 (bard.google.com/updates),看到下图所示的更新,就代表你在 Bard 上使用的模型确实是 Gemini Pro。

本文将介绍它的 8 个独具匠心的功能。这些功能是 GPT-4 所欠缺的,或无法匹敌的。它的中文能力吊打 GPT-4,甚至超过国产大模型。

为了更客观地评估其能力,我在大多数情况下使用英文提示词进行测试,只有在最后需要展示其中文能力时才会使用中文。

1. 精准搜图

Gemini Pro 集成了世界上最大的图片搜索引擎——谷歌图片,使得它的图片搜索能力比谷歌还强。比如我输入以下提示词:

Prompt: close-up aerial view of a woman’s hands holding a plate of colorful dim sum

提示词:特写鸟瞰,一名妇女双手捧着一盘五颜六色的点心

我居然搜到了我在知乎文章中使用的图片。这张图片是我用 Midjourney 生成的。点击这张图片,就可以访问我的知乎文章去看原图。

我甚至用谷歌图片都搜不到能够精准匹配我的提示词的图片。

2. 以图搜物

我给自己的移动硬盘拍了张照片,然后上传到 Gemini,并写了如下提示词:

Prompt: Share the Amazon selling price for this item and include a link for purchasing it.

提示词:分享该商品的亚马逊售价,并附上购买链接。

然后 Gemini 就帮我找到了同款硬盘的亚马逊链接,虽然给出的售价和实际的不太一样。它还提醒我找不到一模一样产品编号的商品。当然,每个商品的编号都不一样。

我试了 GPT-4,没法给出亚马逊的链接。

3. Gmail 助手

Gemini 也是谷歌邮件的好帮手。用它写好邮件,就可以直接在 Gmail 里编辑并发送,非常方便。

Prompt: Draft an email to my recruiter to accept the Social Media Manager job offer and negotiate a later start date

提示词:给我的招聘人员起草一封电子邮件,接受社交媒体经理的工作邀请,并商议一个更晚的开始日期

点击下方的按钮 “Draft in Gmail (在Gmail里编辑)”,就会弹出 Gmail,正文内容已经在里面了。

此外,它还可以总结邮件内容。

Prompt: Summarize my recent emails from Reddit.

提示词:总结一下我最近从 Reddit 收到的邮件。

4. Youtube 助手

世界上最大的视频网站 Youtube 也归谷歌所有。Gemini 充分体现了这个优势。用它来寻找或总结 Youtube 视频,太方便了。这点是 GPT-4 没法比的。虽然 ChatGPT 插件 VoxScript 也很棒,但毕竟没有 Gemini 方便和流畅。

Prompt: I bought a fiddle leaf fig plant, find me YouTube videos of how to take care of it

提示词: 我买了一株无花果,请帮我在 YouTube 上找到如何照料它的视频

Gemini 不仅可以非常迅速找到视频,而且在 Gemini 页面上就可以直接观看,非常方便。

它的视频总结功能也非常迅速和强大。

5. 超级联网搜索

Gemini 把谷歌搜索引擎的优势发挥到极致。谷歌的核心业务就是通过谷歌搜索引擎卖广告。大模型本身的信息搜索功能对谷歌搜索引擎来说是个威胁。但这一次谷歌觉醒了,Gemini 的发布无疑是“挥刀自宫”。

有了谷歌搜索引擎的加持,Gemini 的联网搜索功能太强大了。虽然 GPT-4 借助 Bing 搜索引擎也能执行基础的联网搜索,但跟 Gemini 相比就是小儿科了。不仅速度慢,而且遇到复杂的搜索任务就“歇菜”了。

来看下面这两个例子。

Prompt: Create a table summarizing the specifications, prices, and links to Amazon or BHPhoto for three cameras: Canon EOS R50, Nikon Z 50, and Sony a7 iv.

提示词: 创建一个表格,概述三种相机的规格、价格以及亚马逊或 BHPhoto 的链接: 佳能 EOS R50、尼康 Z 50 和索尼 a7 iv。

Gemini 给出汇总表格的速度简直令人惊讶。而且它还能给出相机的购买链接。

表格下方还有一个按钮,点击这个按钮就可以把表格导出到 Google Sheets。

激活了 WebPilot 联网插件的 GPT-4 却无法完成这个任务。

再来看个更复杂的任务。

Prompt: Organic Food Products Market Study: Task: As a food industry analyst, investigate the organic food products market. Objectives: Identify the top 5 companies producing organic food products. Examine their product range, pricing, organic certification standards, and customer reviews. Assess the advantages and disadvantages of each brand, and provide links to the respective company websites. Organize the findings in a structured report with tables.

提示词: 有机食品市场研究: 任务: 作为一名食品行业分析师,调查有机食品市场。目标: 确定生产有机食品的前 5 家公司。考察它们的产品范围、定价、有机认证标准和客户评价。评估每个品牌的优缺点,并提供相应公司网站的链接。用表格将研究结果整理成一份有条理的报告。

如此复杂的任务,Gemini 也很快就能完成。

GPT-4 则不知道经过多少轮对话才能完成,最终也未必能达到效果。

6. 生活伴侣

Gemini 集成了谷歌地图,谷歌航班,谷歌酒店,是一个很棒的智能生活助理。

Prompt: The pipe under my sink is leaking and I need a plumber. Show me plumbers in my local area.

提示词:我水槽下面的管道漏水了,我需要水管工。请帮我找找当地的水管工。

Gemini 不仅帮我列举了水管工,还在谷歌地图上进行了标注。

再看一个例子。

Prompt: Find hotels for a 4-day trip to San Francisco for New Years Eve

提示词: 为庆祝新年前夜的旧金山 4 日游寻找酒店

7. 识别中文

Gemini 比 GPT-4 识别中文的能力强很多。我上传了一个书籍封面,上面有很多很小的汉字,它的识别率很高。

相比之下,GPT-4 识别的能力差很多。

8. 中文理解

Gemini 的中文能力比 GPT-4 强多了。甚至比国产大模型还强。它有更丰富的中文语料。我把一个对对联的任务分别交给 Gemini、GPT-4、文心一言、通义千文和讯飞星火,来看看它们的表现。

Gemini:

GPT-4:

文心一言:

通义千问:

讯飞星火:

总结

作为一个对标 ChatGPT 3.5 的产品,Gemini Pro 的表现令人刮目相看。谷歌这次真的是拼了!Google Brain 团队和 DeepMind 融合之后,拥有了巨大的人才优势。拥有谷歌搜索引擎和算力资源的谷歌,有望赶超 OpenAI。让我们期待 Gemini Ultra 的表现吧!

类似文章

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注