Vito - 智启光信息技术

Midjourney 通向摄影大师之路

ByVito 2023年11月13日2023年11月13日

随着 Midjourney 版本的不断更新，生成逼真图像的质量也越来越高。你可以随手写一个提示词，Midjourney 就为你创造了一副栩栩如生的摄影作品。然而，有时候结果却让我们大失所望。生成的图片既不像真实的摄影作品，又不像艺术家的绘画作品，而是介于两者之中不伦不类。其实，只要我们拥有摄影师的思维，在提示词中正确地使用词汇，就可以很精准地让 Midjourney 达到我们心目中的理想效果。本文将由浅入深地让你拥有这样的思维，掌握基本和高级的提示词技术，发挥 Midjourney 生成逼真图像的最大潜力。写实图像的基本建议 (Photorealism) 你是否曾经想要 Midjourney 生成逼真的图像，但结果却生成了类似于绘画的效果。比如说，你输入提示词 “a young woman”，Midjourney 可能生成一幅这样的图片：其实，只需要略微调整一下提示词就可以了。以下是几点建议： 1. 把与照片相关的词纳入提示词往提示词里添加 “photo”, “photograph (照片)”，”raw image (raw格式图片)”，”photography (摄影)” 等词，就可以生成一幅逼真的照片。 Prompt: portrait photography of a young woman (一个年轻女人的肖像摄影) 2. 使用跟商业图片库相关的词商业图片库往往有大量摄影师上传的作品。加入 “stock image”, “getty image”，”shutterstock”，”pixabay”，”unsplash” 等词也可以产生逼真的效果。 Prompt: getty image of a young woman Prompt: a…

ChatGPT

11 个非常简短却非常神奇的 ChatGPT 指令，刷新你的认知

ByVito 2023年11月13日2023年11月13日

人工智能日益成为我们工作和生活的一部分。ChatGPT 作为人工智能的代表性工具，它的有效性取决于人们使用它的程度，这也是提示词工程 (Prompt Engineering) 发挥作用的地方。提示词工程是指精心设计有针对性的问题或陈述，以从 ChatGPT 等语言模型中提取最有用、最准确和最全面的信息。尽管 ChatGPT 的设计可以理解和响应各种查询，但如果你知道如何以正确的方式提出正确的问题，回答的质量就会大大提高。本文将介绍 11 个短小精悍的提示词，让你很容易记忆并应用它们。(PS: 在跟 ChatGPT 对话时，我大多数情况下都用英语，因为这样能生成更好的回答。英语吃不消的时候，我会用 DeepL 翻译一下。当然，本文介绍中文提示词也同样有效。） 1. Let’s Think Step by Step (让我们逐步思考) ChatGPT 和人脑的结构是不同的，它并没有人类的逻辑能力。我在之前的文章里介绍了 ChatGPT 非常强大的数学能力，它甚至能解决微积分问题。它的 “推理能力” 源于思维链技术。这种技术引导 ChatGPT 将复杂问题分解为较小的，它可以轻松处理的部分，最后将这些部分连接起来，形成一个连贯的见解。而这个神奇的提示词可以帮助 ChatGPT 把问题拆分成更小的部分从而提升解决问题的能力。来看一个例子，我问 ChatGPT 这样一个问题：在 “AI is not a replacement for human intelligence.” 这个句子当中，第 5 个单词是什么？它竟然告诉我是 “not”。其实并不是它笨，而是 ChatGPT 这样的大语言模型不像人类那样来把句子分解为一个个单词的。它是按照 Token…

Midjourney

【万字干货】掌握 Midjourney 提示词技巧成为 25 个流派的摄影大师

ByVito 2023年11月13日2023年11月13日

Midjourney 以其惊世骇俗的图像生成能力彻底变革了摄影艺术。从此每个人都是一个艺术家，在 Midjourney 的数字画布上的每一笔都不是一抹颜料，而是一个变革性的想法。它之所以能够生成如此逼真的图像，就是因为它用成千上万的摄影图片训练而成。因此，Midjourney 与摄影存在千丝万缕的联系。熟悉摄影中的各个流派，掌握每个摄影流派的底层逻辑，对于发挥 Midjourney 生成逼真图像的能力至关重要。本文不仅介绍了各个流派的特点，而且还详细说明了如何针对每个流派写 Midjourney 的提示词。在每个流派的部分都附上了示例的图片，以及若干个提示词。相信你通读全文之后，一定能拥有摄影师的思维，掌握一种超越传统摄影界限的视觉语言。人像摄影 (Portrait Photography) 人像摄影的本质是捕捉个人或群体的个性和情绪。在 Midjourney 中，如果你只是用 “portrait (肖像)”, “portraiture (肖像画)”，”face (脸)”，”expression (表情)” 这些词，未必会生成人像摄影，可能是一幅肖像画。如果要生成逼真的肖像，可以使用 “portrait photography” 这个词。或者一些跟摄影有关的词，比如添加一个我之前文章里提到的相机型号，或者提到 “camera” 或 “shot” 这样暗示是相机拍摄这样的词。 Prompt: A 5-year-old boy wearing a superhero costume looking towards the camera with a big smile (一个身穿超级英雄服装的 5 岁男孩微笑着望向镜头) 其他的人像摄影相关的提示词还有： photo of…

ChatGPT

如何让 ChatGPT 接收或输出万字长文，突破 Token 限制

ByVito 2023年11月13日2023年11月13日

ChatGPT 强大的自然语言能力让人不得不为之惊叹，但其 Token 限制仍让许多用户不胜其烦。虽然 Claude 2 的 Token 容量更大，但 ChatGPT 的用户群远远超过了 Anthropic 的同类产品。本文将介绍如何突破 Token 限制，不仅让你可以上传更长的文本，也可以让 ChatGPT 输出万字长文。通过实际案例，你将一步步了解如何操作这一过程，从而释放 ChatGPT 更多的潜力。为什么 ChatGPT 有 Token 限制人类是以字数 (单词数) 来计算文本长度的，大语言模型 (LLM) 却不是这样的计算方式。ChatGPT 使用 Token 把一个句子分解成若干部分。 Token 可以是一个单词、一个单词中的一个部分、甚至是一个字符，具体取决于它使用的标记化方法 (tokenization method)。例如，句子 “ChatGPT is great !”可能会被分割成 [“Chat”, “G”, “PT”, ” is”, ” great”, “!”] 这 6 个 Token。你可以使用 OpenAI…

Midjourney

10 + Midjourney 的光线类型（附提示词）

ByVito 2023年11月13日2023年11月13日

灯光是视觉艺术的关键元素，可以极大地影响图像的情绪、构图和风格。虽然 Midjourney 会自动根据场景添加不同的光照效果，但是根据自己的需求添加不同的灯光效果可以产生更加精美和专业的结果。可控灯光效果你可以在 Midjourney 提示词中添加可控灯光效果来达到特定的艺术效果。可控灯光指的是可以通过人工操作改变灯光的效果。主光源 (Key Lighting) 主光源是主要光源，对于增加主体的深度和维度至关重要。它可以让人脸看起来更立体，让风景看起来更有质感，让静态物体看起来更坚固。主光的角度也决定了整体基调——侧面照明显得引人注目，而正面照明则令人愉悦。通常情况下，在 Midjourney 提示词里包含 “studio portraiture (工作室肖像)” 或者 “studio photography (工作室摄影)” 就会让让主体处于主光源之下。 Prompt: a joyful young woman holding a Bichon Frise, studio portraiture in the style of Annie Leibovitz (欢乐的年轻女子抱着比熊犬，安妮·莱博维茨风格的摄影棚肖像) 逆光 (Backlighting) 在 Midjourney 中为主体添加逆光效果，可以使主体从后面被照亮，突出主体的轮廓，让主体和背景分离。这不仅增加了一种空灵、梦幻的效果，而且使得主体显得更加立体。 Prompt: an extreme close up of a dandelion seed head…

ChatGPT

ChatGPT 和 Midjourney 提示词优化神器，竟然不需要魔法，支持 17 个大模型 10 国语言

ByVito 2023年11月13日2023年11月13日

我是偶然间发现这款产品，它的特色功能吸引了我——它可以优化多国语言（包括中文）的提示词，还可以一键转化为优化好的英文版本，而且支持各种大模型，甚至还包括 Midjourney 和文心一言。这可比那款同名的 ChatGPT 插件强太多啦。最关键的是它不要魔法，如果你的工作语言是中文的话，可以登录这个网站 promptperfect.jinaai.cn。如果你通常使用英语的话，可以登录 promptperfect.jina.ai。当我创建账户时，居然还发现它支持微信登录，便怀疑它是否是一家中国公司。背调了一下，果然，创始人是中国人，总部在北京，2020年就成立了，分公司在深圳和柏林。下面我们来通过实际案例看看它优化提示词的效果。优化 ChatGPT 提示词如果你不习惯英文界面，可以在左边的菜单栏点开设置并在设置界面里面把语言切换成中文。设置好以后，在左边的菜单栏选择最上面的“提示词”选项。默认的模型是 ChatGPT，默认生成英文版本的提示词。如果要生成中文版本，需要在插件里面把语言设置成中文。它还有很多自定义设置，比如可以设置优化的质量，或者生成更简洁的版本。为了演示它平均的效果，我选了最低的配置。设置好以后，我输入提示词并点击右边的按钮。接着，我就得到了一个非常详细的中文版本的提示词。它还提供了一个预览界面，对比优化前和优化后的两个提示词提交到 ChatGPT 之后的回答。为了更精准的对比，我把这两个提示词提交给 ChatGPT 3.5。下面是提示词 “如何提升专注力” 生成的回答：这个是提示词 “我想请你提供一些关于如何提高专注力的建议。在回答问题时，请使用清晰明确的语言，并包含具体的方法和技巧。以下是一些建议方向： – 如何减少干扰因素，创造一个专注的环境 – 掌握有效的时间管理技巧来保持专注 – 训练大脑以增强专注力和集中注意力 – 使用工具或应用程序辅助专注力训练 – 养成良好的健康习惯以促进专注力在解答问题时，尽量给出具体且实用的建议，同时鼓励灵活性和创新性，以便符合个人需求并实现持续的专注力提升。” 生成的回答：优化前后的提示词生成的回答对比还是很明显的。优化前的提示词生成的回答罗列了13个简单的建议，并没有什么重点。而优化后的提示词生成的回答总结成了 5 大建议，并针对每个大的建议里面又列出了两三个小的建议。令我感到吃惊的是，优化好的提示词里面其实已经给了 ChatGPT 这 5 大方向，这是一般的提示词生成器无法做到的。比如说我在之前的文章里设计的用于优化提示词的指令，效果并没有它的好。不过 promptest 这个…

Midjourney

Midjourney【局部重绘】详细教程

ByVito 2023年11月13日2023年11月13日

你是否曾经精心设计了一个 Midjourney 指令，虽然不停地 roll，但是某些元素就是无法呈现出来？你是否曾经生成了一张很完美的图，但是某个元素破坏了整个画面的美感？或许你想创建一系列风格相似的人物或动画，只是想让每一个的表情或者配饰有所不同。这一切在今天，七夕佳节，可以实现了。不知是巧合还是有意安排，Midjourney 居然上线了大家期待已久的局部重绘功能。你可以轻松选取一个区域，让 Midjourney 根据你的指令改变这个区域的内容。让我们来看如何使用吧。如何使用首先输入 “/settings” 命令打开设置。点亮 “Remix mode” 的按钮。当你已经生成了四张图像以后，点击其中一个 U 按钮放大你最喜欢的一张图。点击了按钮以后，你会看到出现了 “Vary (Region)” 按钮。如果你没有出现的话，可能需要更新一下 Discord 客户端。点击了 “Vary (Region)” 之后，就弹出了一个窗口，在里面你可以拖动选择需要编辑的区域。如下图所示，左下角的两个按钮可以切换选择区域的方式。默认是矩形选框工具，效果如下图所示。点击右边的按钮则切换到手绘选择，下图是动画说明。 Midjourney 默认会保持你选中的区域，即使你关闭了窗口。区域的大小会影响生成的效果。较大的区域让Midjourney 拥有更大的自由度生成更多有创意的细节。较小的区域则会生成更细小而微妙的变化。要撤销刚才选择的区域，请点击窗口左上角按钮的 Undo 按钮 (或者你可以按快捷键 CTRL + Z) ，如下图所示。比如说我要给斗牛犬添加一个墨镜，如下图所示，我需要在文本框里把原先的指令删掉，然后写上 “sunglasses” 并点击箭头按钮提交。然后 Midjourney 就为我生成了下图的四个版本。手绘选择工具虽然只有两个简单的选择工具，但是它们设计的很巧妙，都可以通过多次拖动叠加选择复杂的形状，尤其是手绘选择工具。比如我要把斗牛犬的围巾变成其他东西，可以通过手绘选择工具把围巾选出来，如下图所示。然后我就可以变成其他东西了，比如丝巾。比如冬帽。比如狮子的鬃毛。最后，祝大家七夕快乐。

ChatGPT

掌握这个【公式】，成为 ChatGPT 提问高手

ByVito 2023年11月13日2023年11月13日

在人工智能大行其道的时代，与大语言模型进行有效沟通的能力变得越来越重要。你可能发现有些 ChatGPT 的回答只是泛泛而谈，而有些则深入而透彻。其实它回答的质量很大程度上取决你的指令。精心设计一个深思熟虑、结构良好的指令将大大提升 ChatGPT 输出的质量。本文将高质量的指令总结成一个公式：理想的指令 = 任务 + 背景 + 范例 + 角色 + 格式 + 语气。虽然这公式里的六个元素都很有价值，但它们的重要性时有层次的，且听我娓娓道来。任务 (Task) 要让 ChatGPT 成为我们的助手，首先要给它指定一个明确的任务。指定任务是这个万能公式的核心，它像一个指南针，引导 ChatGPT 朝着既定目标前进。指定一个清晰而明确的任务，可以让 ChatGPT 从庞大的知识库中调取最相关的知识，生成高质量的响应。下面是一些给 ChatGPT 指定任务的建议：任务背景 (Context) 提供相关的任务背景对于写一个有效的指令至关重要。之所以如此，因为以下原因：如果不提供背景信息，ChatGPT 甚至都无法完成某些任务。例如我在之前的文章中，让 ChatGPT 为我生成 Midjourney 的指令。可是 ChatGPT 的训练数据在2021年9月之前，它甚至都不知道 Midjourney 是什么。我只有在指令中告诉它 Midjourney 是什么，如何写指令等等，才把它训练成一个 Midjourney 指令生成器。在提供上下文时，你可以回答这样一些问题：回答了这些问题，你可以将任务背景纳入 ChatGPT 指令，例如：作为一名正在撰写机器学习课程研究论文的计算机科学专业的学生，我拥有神经网络的基础知识和一些 Python 编程的经验。我需要总结监督式、无监督式和强化学习算法之间的主要区别。请用三个简短的段落对每种方法进行概述。范例…

Midjourney

把各种相机加入 Midjourney 指令，效果惊呆了我！

ByVito 2023年11月13日2023年11月13日

你是否想过在 Midjourney 创作中打破常规，让生成的图像与众不同？无数的大师们都曾用过各种型号的相机和胶片创造出了伟大的作品。将这些相机和胶片的信息放入 Midjourney 指令就可以生成独特的作品。从动感十足的运动相机，到俯瞰万物的无人机。从浓艳动人的彩色胶片,到细腻质感的黑白胶片。每种相机和胶片都能赋予照片与众不同的个性。让我们一起探索吧！相机运动相机 (Action Cameras) 运动相机是专门为运动场景设计的相机，和单反相机相比，拍出的照片有独特的艺术效果。大多数运动相机都有非常广角的镜头，类似于单反相机的鱼眼镜头。拍出的照片图像中心被放大，边缘有变形的效果。这种效果可以让观众拥有第一人称视角，感觉身临其境。很多运动相机都会在默认设置中增强色彩的鲜艳度，拍出来的照片非常生动抢眼，尤其是在光线充足的情况下。因此，如果你想生成运动题材的照片，比如极限运动（滑板、滑雪、越野摩托车、攀岩），水上运动（游泳、冲浪、潜水、皮划艇），骑行等，都可以考虑在 Midjourney 指令中加入一些运动相机，比如 GoPro Hero，DJI Osmo，Insta360 等等。 Prompt: woman, skiing, leaping, full body shot (女人, 滑雪, 跳跃, 全身照) Prompt: woman, skiing, leaping, full body shot with GoPro hero (女人, 滑雪, 跳跃, 用 GoPro Hero 拍摄全身照) 如果你不想加相机的话，也可以考虑加入第一人称视角，比如：”POV shot”, “subjective shot”, “first-person shot”。…

ChatGPT

用了这 4 个 ChatGPT 插件联网搜索，我震惊了！

ByVito 2023年11月13日2023年11月13日

很多人把 ChatGPT 当成搜索引擎来用。他们向 ChatGPT 提出问题，希望快速获得想要的答案。尽管 ChatGPT 确实知识渊博，可以回答很多问题，但和所有的大模型一样，数据都无法实时更新。你问的问题里如果包含最近的信息，ChatGPT 就变成甩手掌柜了。搜索引擎如谷歌和 Bing 虽然也利用 AI 技术来改进搜索体验，可以帮你汇总多个网站的信息，但无法像 ChatGPT 一样处理稍微复杂的任务。比如你无法让谷歌或者 Bing 把搜索到的信息汇总成一张表格。然而人们经常在工作或生活中会有这样的需求。比如浏览不同的网站调研产品，然后把有关产品的关键信息提炼出来，最终形成一个表格或者一篇文章。让 AI 协助你快速完成此类任务已经成为现实，我在之前的文章里介绍了各种方法。 👉 所有ChatGPT用户都可以联网搜索啦 ChatGPT 免费用户可以使用谷歌浏览器插件，而对于 Plus 用户来说，更好的方式应该是安装 ChatGPT 插件。本文将通过实际案例比较 WebPilot，KeyMate.AI Search，MixerBox WebSearchG 和 TotalQuery Search 这四款插件的能力。文章的最后给了一些使用这些插件的建议，如何最大化它们的效果。四个插件的简介 WebPilot，BrowserOp，KeyMate.AI Search，和 MixerBox WebSearchG 的功能大同小异，最大的区别是它们的能力。它们的使命都是通过联网完成 ChatGPT 用户提交的任务。比如你可以总结某个网页的内容，从中提取你想要的信息，问有关该网页内容的问题，翻译网页内容等等。如果你想要跟一个网页互动，那么这些插件基本都可以达到你的预期。有些插件甚至还支持你跟在线的 PDF 进行互动，但这个功能并不重要，因为类似 AskYouPDF 之类专门跟 PDF 进行互动的插件效果会更好。真正考验这些插件能力的地方在于更复杂的多网页信息提取。并不是所有的插件都能够根据用户的 ChatGPT 指令精确地了解用户的需求，并转化为实际的多步骤搜索任务，最终迅速生成满意的结果。为了说明它们之间能力的差异，我们来看几个案例吧。…