Gemini - 智启光信息技术

我发现谷歌 Gemini Pro 的这 8 个功能连 GPT-4 都自愧不如

ByVito 2023年12月10日2023年12月10日

谷歌的聊天机器人 Bard 已经发布很久了，但我始终都没当回事儿，当然也很少用它。直到前两天，谷歌和 DeepMind 合作的大模型 Gemini Pro 被植入 Bard，一时间竟有碾压 GPT-4 之势。我在之前的文章中对 Gemini Pro 和 GPT-4 进行了深度比较。 👉 谷歌 Gemini 吊打 GPT-4？来看我的深度测评 Gemini Pro 在很多方面和 GPT-4 存在较大差距。然而，作为一个对标 GPT-3.5 的产品来说，已然成功了。它本身就是一个多模态的大模型，可以联网，也可以识图，和 GPT-3.5 没有可比性。如果还没有体验过，可以访问 bard.google.com。确保谷歌账户的国家和 IP 是米国，语言是英语。如果你访问它的更新日志 (bard.google.com/updates)，看到下图所示的更新，就代表你在 Bard 上使用的模型确实是 Gemini Pro。本文将介绍它的 8 个独具匠心的功能。这些功能是 GPT-4 所欠缺的，或无法匹敌的。它的中文能力吊打 GPT-4，甚至超过国产大模型。为了更客观地评估其能力，我在大多数情况下使用英文提示词进行测试，只有在最后需要展示其中文能力时才会使用中文。 1. 精准搜图 Gemini Pro 集成了世界上最大的图片搜索引擎——谷歌图片，使得它的图片搜索能力比谷歌还强。比如我输入以下提示词： Prompt: close-up aerial…

Gemini

谷歌 Gemini 吊打 GPT-4？来看我的深度测评

ByVito 2023年12月7日2023年12月7日

万众期待的谷歌最新的大模型 Gemini Pro 发布了！之后还会上线更强大的 Gemini Ultra 。曾经听到新闻说 Claude 2 超越 GPT-4，后来又听说谷歌 Bard 超越 GPT-4。今天一觉醒来，又听说 GPT-4 被谷歌 Gemini 超越了，不由得问自己：这是真的吗？很多博主一看下面这个表格就说 Gemini 全面超越了 GPT-4。毕竟这是权威的 benchmark，数据都是真实的。实际上，这个指标也可以作弊的。如果有意把用于评估大语言模型的的测试数据包含在大语言模型的训练数据时，它自然会表现得更出色。就像考试一样。如果提前知道考试的内容包含在哪几本书里。然后考前拼命学习那几本书，最终的成绩可能会比那些平时很用功，但并不知道考试内容的学生最终取得的成绩要好。当然，我并不是说谷歌在作弊，只是说不能单纯靠这些 benchmark 来判断大模型的优劣。下面我们来通过 Token 容量、长文本总结、知识更新、推理能力、数学能力、联网搜索能力、识图能力、中文支持等 8 个指标，对比谷歌 Gemini Pro 和 GPT-4 的能力。目前 Gemini Pro 免费，如果还没有用过，可以访问这个网址：https://bard.google.com/。Gemini Pro 这个模型已经接入谷歌 Bard。确保你的谷歌账号的地址是漂亮国。需要说明的是，我在测试过程中用的是英文提示词，因为这样才能客观地进行比较。毕竟模型主要的训练数据是英文。中文提示词出来的结果不佳，可能是模型的中文训练数据不够，并不代表模型本身的能力不强。文末，我也会用中文提示词，测一下两个模型对中文的支持力度。 Token 容量 Token 容量是评估大模型非常重要的一个指标。说的直白一些，就是你跟大模型进行一次完整的对话，大模型能容纳多少单词。比如让大模型总结一本书的内容，如果被允许容纳的单词越多，那么我们就可以总结更长的文本。在跟大模型的多轮对话中，如果 Token…