生成式 AI 作为画布：创作者和设计师指南

互联网上涌现出许多由生成式人工智能创造的令人惊叹的视觉效果。而似乎你所需要做的就是与AI“对话”？

AI会取代创作者或设计师吗？

简而言之：不会！由于众多未知因素，对AI技术的这种恐惧只是自然而然的。创作被分享，但很少谈论其限制。这导致了对这项新技术将如何融入当前行业以及对创作者、设计师或艺术总监等工作的影响产生了不确定性。

这正是我们在本文中要讨论的内容。与其采用一种不明智的非黑即白的观点，不如将AI视为你的超能力。

胜利的循环

创作者和他们的客户通常会多次进行反馈和思想交流。客户希望结果与其价值观和品牌保持一致，并且可能已经有一个具体的愿景——“我的产品应该看起来专业且性感”。为此，创作者提供了一些客户可以选择的替代方案，并使用反馈进行进一步的开发。在这个构思阶段，AI可以极大地加速创作者和他们的客户之间的迭代周期。这确实是一种双赢…

作为创作者，构思过程需要很多耗时的替代方案，比如情感板和活动视觉材料，以提供给客户选择。借助生成式AI，这些替代方案可以在瞬间生成。此外，可以将其视为你个性化的灵感来源。可口可乐最近的AI启发营销活动就是一个令人惊叹的例子，展示了AI如何增强灵感！

从创作者的客户角度来看，很难明确地传达视觉想法。生成的图像可以为创作者提供在风格和构图方面的参考，极大地加速了早期客户简报。例如，Radix营销部门利用生成式AI快速生成概念，以启动他们的设计代理公司。该代理公司的艺术总监现在可以从一开始就与客户的期望保持一致。

生成式AI模型：购买还是构建？

在生成式AI模型的海洋中穿行可能会让人感到不知所措。模型的选择通常取决于你的特定用例以及是否需要可定制的解决方案。简而言之，问题就是：应该购买还是构建？

购买：生成式AI作为一种服务

首先，我们有AI作为服务的专有解决方案，比如OpenAI的DALL-E2，以及Midjourney以更具神秘感的图像风格为特点。这两者在上面最左边的两幅图中进行了比较。由于这种基于AI的工具是作为一种服务提供的，通常会附带订阅费用或每个生成图像的成本。

这些模型在易用性方面表现出色，只需点击按钮即可立即生成令人印象深刻的图片。AI作为一项服务可以直接在浏览器中使用，或者可能已经集成到工作流程中，例如Photoshop的生成填充。

通常还包括一些酷炫的AI自动编辑功能，可以更改图像的部分内容，甚至在图像边框之外添加新的部分。然而，它们仍然受限于预设功能。无法添加自己的产品或风格，并且对生成的内容的控制有限。

构建：可定制的开源模型

与这些专有模型形成鲜明对比的是免费使用的开源模型！主要示例是由Stability.AI发布的Stable Diffusion，其理念是将AI交到人们手中，以加速该领域的进展。

有了这种免费访问权限，你甚至可以在自己的笔记本电脑上运行Stable Diffusion。用户界面（如EasyDiffusion或Automatic1111）使你可以轻松生成图像，而无需编写任何代码。

这些开源模型的主要优势在于，有机会构建自己独特的生成式AI，而不必依赖第三方。可以根据自己的风格和产品定制模型，甚至可以为不同的用例拥有多个模型。

使用通用生成式AI

现在你对何时购买或构建生成式AI有了更好的了解，让我们看看如何实际使用它！

我将讨论基本上所有“购买”或“构建”解决方案中都可用的两种选项：可以通过提供文本（提示）或参考图像来控制它。

（1）使用文本进行控制

这是生成式AI最著名和最常用的功能。它就像看起来那样简单——写下想法，点击“输入”，然后大功告成！AI将你的文本想法转化为图像，可视化思想的本质。

（2）使用参考图像进行控制

可以提供一个参考图像，并观看AI生成不同的变体，调整调色板、风格，甚至将其他对象加入图像。这些变化还可以由你提供的文本来控制。

例如，在下面的沙滩上的猫的图像中，我们可以让AI生成一个变体。通过向AI提供额外的文本，我们可以控制要添加的新元素：雷和闪电。请注意，尽管这对于获得构图的变体非常有用，但很难控制要保留在图像中的哪些部分。在下面的示例中，你可以看到场景和构图非常相似，但除了雷和闪电之外，其他元素也发生了变化：鸡尾酒、猫上的眼镜和背景中的沙滩椅。

要更有针对性地编辑图像的特定部分，可以使用画笔标记它们。这被称为修补，生成式AI现在将尝试仅编辑标记的区域，从而提供更多控制！可以使用它来摆脱任何不需要的组件，或者甚至可以将新的或替代的对象带入场景中。如果猫应该在你的广告活动中代言咖啡而不是鸡尾酒，我们只需标记杯子并键入应该替代的内容：一个咖啡杯。

除了修补之外，我们还可能希望更改广告活动中所有媒体的猫图像的宽高比：让我们制作一个广告牌！AI将绘制边框，这就是所谓的外扩。让我们将我们的图像制作成宽屏，让AI生成合理的边框。这也可以通过附加文本进行引导，例如“阳光沙滩”。

下一阶段：个性化生成

以上所有内容基本上在所有生成式AI服务（“购买”时）中都可用。但可以看到，它只生成了一般的对象和构图……

可以获得特定于客户的生成吗？当“构建”而不是“购买”时，你可以获得特定风格、客户的品牌或产品的定制生成。除此之外，我们还可以控制生成，超出了仅仅是文本和图像变化。

换句话说，定制解决方案可以带你进入整个新的层次！我将向你展示如何（1）添加自己的概念，（2）增强生成控制，以及（3）升级为特定于品牌的生成！

（1）添加自己的概念

让我们从如何向生成式AI添加新概念开始。这可以范围从添加您最喜欢的杯子到甚至添加您自己。创新的方法，比如Dreambooth和Textual Inversion，可以通过提供仅仅几个示例图像来实现这一点。在下面的图像中，通过收集大约10张照片，我们可以生成Davio，Radix的首席执行官，他以不同的构图，由文本引导。

（2）增强控制

但为什么要止步于添加概念呢？让我们深入探讨，更多地控制你的创作，使用最新的ControlNet来实现。我们现在可以使用参考图像来复制一个人的特定体态，或者使用其轮廓来生成你的创作！

从参考图像中，我们可以提取一个人的体态，并让AI仅生成完全相同体态的人。想象一下，在进行实际拍摄之前，你可以如何起草想法。让我们生成超人做疯狂的跳跃：

接下来的一个功能让我感到非常兴奋。无论你制作了什么草图或涂鸦，现在都可以让它活过来！在下面，我在Paint中快速起草了一只熊，告诉AI我希望它看起来像一个可爱的卡通熊玩偶，然后它就出现了。与仅使用文本有什么不同？看看构图，它紧密地遵循你的绘画！你的基本概念草图现在可以立即变成现实，为你的头脑风暴和概念艺术提供强大的支持。

（3）特定于品牌的生成

尽管非定制模型是通过大量数据训练以满足其所有用户的需求，但通常我们只希望为你的用例获得真正出色的结果。例如，当我们的目标是逼真的摄影时，我们对绘画不感兴趣。幸运的是，通过使用特定风格的图像示例来训练现有的Stable Diffusion，我们可以使其成为生成这种风格的专家！只需看看这款Gelato风格模型生成的一切都好像是由冰淇淋制成的：

工具的局限性

虽然我们主要关注生成式AI的可能性，但现在我将简要讨论其一些局限性。

· 对于AI来说，制作构图真的很难。它可能难以理解物体之间的关系，而且随着场景中的物体越来越多，这变得越来越具有挑战性。例如，“篮子旁边的苹果”的提示可能会导致苹果出现在篮子中。

· 精挑细选：当看到生成式AI模型的结果时，请始终记住生成了许多变体，而你只能看到最好的那些。可能需要多次尝试才能获得所需的结果，而不带有工件，例如过多的手指或变形的脸部。幸运的是，你可以让AI同时生成多个图像，以加快这个过程。

· 排版与生成式AI真的不搭配。文本可能会出现为工件，而且通常甚至不组成有意义的单词。这可能是由于AI在其训练图像中看到了这样的文本示例，例如广告或海报中的文本。将“文本”放入负面提示中可以避免工件。再次强调，我们需要设计师：正确的方法是在后期处理中自己添加文本！这些局限性确实让人意识到AI是一种工具，尽管是一种强大的工具。这只是一种手段，而不是目的。创作者始终将控制创作过程，确保与客户的价值和想法保持一致，并选择在构思过程中生成式AI可以帮助他在竞争对手中脱颖而出的部分。

结论

AI是一种工具。虽然Illustrator和Photoshop曾经是新技术，现在已经成为你工作流程中不可或缺的工具，但生成式AI很可能是下一个新技术！