🧭 AI绘图 之 Text Prompt 篇 场景1、2

场景1:Stock Photo

Text Prompt 的部分,我删除重写了 3 遍,每次写完都不太满意。前两遍,我都希望通过一个或几个万能模板教会大家写 Midjourney 的 Text Prompt,但实际试了很多遍后,我发现:

  1. 图片信息量非常大,万能模板的确让你生成一张及格的图片,但很难让你生成一个完全满意的图片。
  2. 要想生成一张高分图片,需要的不仅仅是 prompt engineering,甚至还需要一些美学知识,不同场景参数的使用都是不一样的,所以有些时候,用模板反而有点死板。

所以,我不想直接教大家所谓的万能模板,而是通过一个个实际场景教大家如何写好 text prompt ,因为不同场景,你告知给模型的信息是不一样的。

而且我认为,知道为什么,远比知道怎么做更重要。当你知道为什么后,遇到新的场景,你也能很好地解构出 prompt 里需要什么,而不是盲目套模板。

最后,图片场景有非常多,我会尽量分享一些大家日常工作中能用上的。希望能让 AI 提高你的工作效率,而不是用完即弃的玩具。

Text Prompt 开篇介绍一下 Midjourney V5 提升较大的 Stock Photo 场景。

什么是 Stock Photo?

Stock Photo 直译为图库图片。一般你能在一些图库网站上找到,这些图片通常来自一些摄影师或设计师。部分图片因为版权的原因,如果你需要使用则需要付费。

大部分使用 Stock Photo 的用户都是一些设计公司,或者广告公司。你应该常常能看到这类图片,比如最经典的两人握手照片:

MJ019.jpeg

我认为 AI 生成图片对图片库冲击非常大,V5 版本基本上满足了我的 Stock Photo 需求。

技巧一:临摹

我认为学习图片类的 prompt,跟学习画画是类似的,最好的学习方法不是直接用模板。

而是拿真图,或者别人生成的图来临摹。英文不好,也可以先写中文,然后让 ChatGPT 翻译。当你临摹了几张后,你就会慢慢搞懂如何做出类似的图了。

拿上面的那个握手图为例,我们仔细观察上面那张图,图中元素有什么:

  1. 第一主体是两个手,然后握在了一起,并且看起来是两个亚裔男人。
  2. 第二两人都穿着西装。
  3. 第三背景看上去像是在办公楼的大门,两人可能是在握手告别。并且背景刻意进行虚化了,或者是使用照相机拍摄的。

MJ020.jpeg

再归纳总结下,大概的信息:

  • 主体:两个穿着西装的亚裔男人在握手告别
  • 场景:办公楼大门
  • 图像风格:stock photo,照相机拍摄,

这时候,我们就能尝试写一下 prompt 了(如果你觉得自己英文水平还不太行,也可以尝试用翻译软件翻译)。

stock photo of two Asian men in suits shaking hands,say goodbye in front of the main entrance of the office building,taken with Canon
 

Midjourney 生成的结果如下所示。

Emm 🤔 好像跟我们的预期不一样。不要慌,刚开始用 Midjourney 一定会遇到这种问题,重要的是多尝试。

图片[3]-🧭 AI绘图 之 Text Prompt 篇  场景1、2-精益AI

我们再来分析下 Midjourney 为何生成了这样的图片?复盘下:

  1. 首先图片的主体,或者说焦点,我们只需要「握手」,而不是两个人。
  2. 照相模式好像并不能实现背景虚化?更像是一种图像风格,图四就像是一种老照片的风格。

那我们调整下 prompt,增加焦点和背景虚化关键词:

stock photo of two Asian men in suits shaking hands,say goodbye in front of the main entrance of the office building, focus on two hands, taken with Canon, background bokeh
 

再来看看生成的结果,结果好很多,图 1 和 图4 基本满足需求了,图 2 和图 3 裁剪一下,也能满足我们的需求。不过需要注意,Midjourney 在人手的生成上,暂时还有点问题,你细看图 2和图 4,其中有一个人的手有 6 个手指 😂,但我认为未来应该会修复:

图片[4]-🧭 AI绘图 之 Text Prompt 篇  场景1、2-精益AI

那我们来总结一下 prompt ,该 prompt 分成以下几个部分:

MJ022.png

  • 第一部分(红色线):描述你想要的内容主体。
  • 第二部分(蓝色线):描述主体背景/环境。
  • 第三部分(黄色线):照片的焦点位置。
  • 第四部分(绿色线):照片的风格或者说是特殊要求。

总结下之后,你是不是就总结出了一个模板了?😁

技巧二:多实验

上述的案例,我还想教给各位第二个技巧:多试验。

图片生成遇到不符合预期的情况,不要慌,分析问题,然后使用控制变量法,一个个调整图片,不要急,上面我写的 prompt 还有一个地方,不知道各位有没有注意,就是开头的 stock photo,试试将这两个词删掉会怎样?

two Asian men in suits shaking hands,say goodbye in front of the main entrance of the office building, focus on two hands, taken with Canon, background bokeh
 

生成结果也依然满足需求,而且手指的数量也准确了,说明这个 Stock Image 对模型的影响不是很大。

图片[6]-🧭 AI绘图 之 Text Prompt 篇  场景1、2-精益AI

技巧三:善用 Image2Image 功能

在 Stock Photo 场景里,还有一个非常厉害的技巧,这个方法我一开始觉得不太适合教,因为这个对 Stock Photo 库影响太大了 😂

但本着工具中立的原则,并且这个技巧,其实在很多场景都能用(比如生成头像等),所以还是觉得有必要教给大家。

各位一般用 Stock Photo 库会遇到以下几个问题:

  1. 图有版权,没法商用,或者说需要付费。
  2. 有些图,被很多人用过,其他人一眼就看出来这是 Stock Photo。
  3. 图里的内容大体符合要求,但细节不符合要求,比如上图两个亚洲男性握手,可能换成一男一女,且其中一人是黑人会好一些。

要解决这三个问题,最好的方式就是让 AI 改一改原来的图片。让 AI 改图,只需要用到 Image2Image(或者叫 Blend) 功能即可。操作步骤如下:

 
信息

后来在某书刷到类似的教程,我才知道这个方法大家一般叫垫图。老外好像一般都叫 Image2Image,或者 img2img。

  1. 将你看到的不错的 stock photo 发给 Midjourney Bot(我还是以前面的那张握手照为例)
  2. 右键复制该图片的链接,然后黏贴到输入框
  3. 在链接后加个空格
  4. 接着输入你想要的内容,比如将其中一个人的手换成黑人,一个人换成女性:
one Afican-American hand and one Asian woman hand
 

生成的结果是这样的,我在 prompt 里没有提任何西装,以及场景背景信息,就说我要一个非裔的手,一个亚裔女性的手:

MJ162.png

抛开6 根手指的问题,这个技巧是不是很高效?不过需要注意,blend 功能(这个后续教程会讲到)我发现更适合两张图融合,图片+文字不是很稳定,各位要有耐心,多测试一下。

 

场景2:品牌 Logo

我们需要学习提示词吗?

前一章各位搞懂了基础 prompt 后,从本章开始就会教大家更多垂直场景的 prompt。关于垂直场景,我看到大量的教程和分享都是分享各种提示词,比如 Logo 相关的提示词有:

  • modern
  • minimalist
  • vintage
  • cartoon
  • geometric

坦率地说,在我学习如何使用 Midjourney 的过程中,我一开始也以为只要看了别人的 prompt 用了别人的提示词,就能生成好的图片。

但对于新手来说,我不建议各位直接上来就记模版,记这些词。

因为写好一段 prompt ,你缺的不是提示词,而是对设计的理解,甚至是想象力。

比如本章节的 Logo 设计,如果你根本不知道 Logo 包含哪些元素,适合什么风格,你懂再多的提示词也没法生成满意的 Logo。正如我 Midjourney 教程前面提到的那样,Midjourney 跟 ChatGPT 不一样,ChatGPT 是声明式的,你甚至可以让它扮演某个角色,但 Midjourney 是指令式的,你只能用指令让它画出你想象中的图片。当你能很稳定地出图后,再研究这些词不迟。

对于普通人来说,真正阻碍我们的可能不是学会这些词语,而是我们的审美。

常见的品牌 Logo 一般分成以下 4 种形式:

  • Graphic Logo:一般以图形为主,像 Apple、Twitter 以及 Midjourney 就是这种 logo。
  • Lettermark Logo:一般用公司名字的首字母作为 logo 主体,像 Facebook、Tesla 还有 IBM (IBM 全称是 International Business Machines)都是用公司名的首字母作为 logo。
  • Geometric Logo:几何图形组成的 logo,比如 Nike、百事可乐、万事达卡就是这个类型。
  • Mascot Logo:以公司吉祥物为 logo 的相对来说比较少见,像米其林的 logo 就是吉祥物轮胎人,我最喜欢的烤鸡餐厅 Nando’s 就是一只🐔

其实常见的品牌 Logo 里其实还有一种,是文字组合式的,文字加上面任意一种,比如 Tesla 的 完整 Logo 就是 Tesla 加一个 T。但因为 Midjourney 在文字的生成上,有非常多的问题,所以不在本章进行介绍。

MJ024.png

当你想用 AI 生成 Logo 的时候,我建议你选一个你认可的方向,然后再让 AI 生成。

首先我们来分析一下 Graphic Logo 的特性:

  1. Logo 类型:graphic logo
  2. Logo 图形描述:比如猫
  3. 风格:
    1. 多为扁平化设计:flat
    2. 多为矢量图形:vector graphic
    3. 简洁:simple

根据特性撰写的 prompt ,核心的关键就是将风格描述清楚:

flat vector graphic logo of cat, simple minimal
 

Graphic Logo 还有一种常见的设计,比如前面的例子里 Midjourney 的 Logo 就是这种,只需要在 graphic 后加一个 line 即可:

flat vector graphic line logo of cat, simple minimal
 

下方左边 4 个是没有加 line 的版本:

MJ032.png

这个根据我的实验,也试用了很多人写的 prompt,我个人的感受是,这种类型的 Logo 看起来简单,就一个字母进行变形,但让 AI 生成反而效果很一般,而且有一个算是比较有意思的发现,用 A 字母做出来的 Logo 质量比其他字母做出来的 Logo 质量要好很多(非严格按照数据统计,仅个人感受)。这个类型的 Logo 有以下特点:

  1. Logo 类型:lettermark
  2. Logo 图形描述:
    1. 纯字母
    2. 字体样式:可以按需加上喜欢的字体
  3. 风格:
    1. 矢量
    2. 简洁:simple minimal

根据特性撰写 prompt(最后生成的是 A 和 C 的 logo,我个人感觉 A 的好很多),另外需要注意,这个例子其实是想说明,在 Midjourney 里,语法并不重要,lettermark 不一样要按照语法要求,写成 lettermark logo of letter A :

letter A logo, lettermark, typography, vector simple minimal
 

MJ028.png

这个类型的 Logo 相对来说,虽然只有图形,但有很多玩法,介绍两个常用玩法:

  • 循环重复

如果你用的是 iPhone ,可以看看 iPhone 里的照片应用的 Logo,它也是一个 Geometric Logo ,而且它是椭圆图形旋转重复,最后组合成了一朵花的形状。拆解一下,关键词是:

  1. Logo 类型:geometric logo
  2. Logo 图形描述:
    1. 旋转重复:radial repeating
  3. 风格:
    1. 简洁:simple minimal

让我们来写一个类似的 prompt:

Flat geometric vector geometric logo of flower, petals radial repeating, simple minimal
 
  • 渐变

另一个常见玩法就是渐变色,如果你用的是电脑的浏览器是 Edge,可以去看看它的 Logo,它的 Logo 就是一个渐变色,然后是个浪的外观。拆解一下,关键词是:

  1. Logo 类型:geometric logo
  2. Logo 图像描述
    1. 浪的形状:curved wave shape
    2. 蓝绿渐变:blue green gradient
  3. 风格:
    1. 简洁:simple minimal

让我们来写一个类似的 prompt:

Flat geometric vector graphic logo of curved wave shape, blue green gradient ,simple minimal
 

最后生成的结果是这样的,我很喜欢花的第三个,浪的第二个:

MJ029.png

这种吉祥物类型的 Logo,我认为是 Midjourney 最擅长的 Logo 风格。但也非常考验我们的想象力,当然我们也可以仅提供一些比较简单的词语,让 AI 帮我们生成,让我们一起来为一个机器人公司写一个 Mascot Logo ,拆解一下 prompt 关键词:

  1. Logo 类型:mascot logo
  2. Logo 主体描述:比如机器人 robot
  3. 风格:
    1. 简洁:simple

最后 prompt:

a mascot vector logo of a robot, simple,
 

还有给一家泡面公司生成一个吉祥物又会怎样:

simple mascot logo for a Instant Noodles company
 

以下是生成的结果,我很喜欢泡面公司的 logo:

MJ030.png

技巧四:增加风格——艺术运动

因为篇幅的原因,本教程不会介绍特别多的风格,我会在我的小红书账号上更新。感兴趣的朋友可以去关注下。

前面生成的 logo ,有一些估计各位会觉得平平无奇,比如 Lettermark Logo,原因并不是 Midjourney 能力不强,而是我们给的指令太少了,只要在 prompt 里加几个单词,就能生成不一样的 Logo: 左边四个的 prompt 是这样的,我仅仅在原来的 prompt 上加了两个单词 Pop Art:

letter A logo, lettermark, typography, vector simple, Pop Art
 

MJ031.png

Pop Art 是什么?

波普艺术(Pop Art,又译为普普艺术或通俗艺术),是一种起源于20世纪50年代和60年代的艺术运动,它强调对大众文化、大众媒体和消费主义文化的反思和表达。Pop 来自“流行艺术”(popular art)一词里的 popular,由1956年英国艺术评论家罗伦斯·艾伟(Lawrence Allowey)所提出。

Pop Art 的特点是:

  • 它的内容主体一般是大众日常生活中常见的物品和图像,如广告标语、杂志封面、食品包装等。
  • 一般用色比较大胆,同时线条比较简洁,强调物品本身的视觉效果和意义。

右边边四个的 prompt 是这样的,我在 prompt 里加上了 De Stijl 。

letter A logo, lettermark, typography, vector simple,De Stijl
 

De Stijl 是什么?

它是一个荷兰艺术运动,始于 1917 年,致力于简化视觉元素,包括直线,平面和基本色彩。

它的成员包括画家 Piet Mondrian 和 Theo van Doesburg 等人。De Stijl 的成员致力于将艺术与设计融合,以创造出具有实用性和功能性的美学。

De Stijl 的特点有:

  • 常常用几何图形进行设计,如矩形和直线。
  • 用色基本只用基本色彩,比如黑、白、灰、红、黄、蓝。
  • 追求平衡和和谐,强调形式和结构,不注重细节和表现力。

看完这些介绍,再看看 Midjourney 输出的 Logo 是不是有那味了?

© 版权声明
THE END
喜欢就支持一下吧
点赞12 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容