许多艺术家、作家、音乐家和创作者已经屈服于对AI抢走他们工作的恐惧。从表面上看,许多生成式AI工具可以在短短几秒钟内完成他们自己可能需要花费数小时才能达到同样质量的工作。许多曾经依赖他们专业知识的地方现在转而使用AI解决方案,以比人工创作更低的成本和更快的速度生产作品。这似乎威胁到所有创作者的生计,导致创意社区普遍感到恐慌。我希望提供一种不同的视角,帮助所有创作者找到一些希望。
AI正在变得越来越擅长模仿。给AI模型足够的数据,关于特定主题或风格,它可以在一定程度上学会复制它。在大多数情况下,这些数据是合法(尽管有争议地)从网络各处抓取的,以建立AI的核心认知模型。不可避免地,这种数据抓取可能涉及到每一个曾在网络上发布过任何内容的创作者。如果你是一位创作者,那么在几乎每一个AI模型中都有你的一部分贡献,社会应该感谢你为这一伟大事业所做的贡献。正是因为你的创作,这些AI模型才能理解什么是“好的”艺术,看起来、听起来或读起来应该是什么样子。它可以模仿你的作品中的风味,并与其他创作者的作品混合,‘幻化’出从未被任何单一创作者探索过的可能的创作。有时这些是令人难以置信的灵感之作,但大多数时候它们是垃圾,不可用。为什么会这样呢?
图像生成AI只关注像素的预测。它没有情感的概念。它可以理解微笑的样子,但无法理解当你感到快乐、喜悦、调情或紧张时,那种感染全身的情感。它可以根据提示预测出微笑所需的像素,但除非经过更多的提示工程来阐明引发微笑的背景,否则这种微笑不可避免地会显得平淡无味。情感是人类独有的,我们通过艺术和创作来表达情感。这正是观众与创作者之间建立起非常个人化联系的纽带。一笔画所能表达的内容,可能需要数章的提示工程才能用文字传达。
你听过“画面胜过千言万语”这句话吗?那么,想想用户如何与这些大型语言模型(LLM)互动来生成一幅图画。当然,你可以输入几个词语,然后让AI增强你的提示,它会生成更多的文字。但是,如果输入太多文字,你最终可能会生成与预期越来越远的垃圾图像。有具体的构想?那就算了吧,你永远无法通过一次提示就生成你想要的图像。大多数情况下,靠近你设想的效果需要经过数小时的提示工程、反复试验和图像编辑,但仍然不完全如你所愿。没有艺术家的引导,生成作品将继续是垃圾,并被归类为新奇玩物。这就是你的价值所在。
在一个简单的提示中加入一张图片,AI立刻有了一个实质性的基础来工作。这样一来,你为想要的结果提供了一个起点,并且你对结果的控制也增强了一些。如果在一个复杂的工作流程中反复进行这样的操作,比如在ComfyUI中,你就能够对可能的输出施加越来越多的控制。
然而,这需要艺术家来塑造它,赋予它所需的情感连接,而在ComfyUI的情况下,还需要一个技术娴熟的艺术家。正是这种对控制力的主张,允许人类在创作过程中进行干预,像艺术家塑造粘土一样,根据自己的意愿塑造创作过程。那么AI在其中扮演的角色是什么呢?它不再是取代艺术家,而是作为一种工具和合作者,与艺术家共同朝着目标努力。这个目标不可避免地包含了我们在艺术中所追求的品质和情感连接,但速度远远快于艺术家单独从头开始创作的速度。
Martin Nebelong秉持这样一种理念:AI只是数字艺术家工具箱中的另一种工具,创作者在这个新时代必须学习如何使用它。他专注于创建利用AI工具进行高度控制的艺术工作流程,从而创作出充满他个人情感共鸣的作品。他在LinkedIn和Twitter上分享这些工作流程和示例。
“我支持创造力,支持艺术,支持AI。我们的工具在变,我们的创作范围在变。我认为创意生成AI工具或模型尚未找到它们的最佳形式;它们存在缺陷、原始且难以控制。但我对它们找到这种形式感到兴奋,也期待它们能作为我们手的延伸、画笔的延伸,放大我们的艺术意图。”——Martin Nebelong
生成的作品需要大量时间和精力来打磨输出,使其真正达到可接受的水准,而通常只能让艺术家完成80%的工作,但正是艺术家投入的最后20%,将作品提升到完美和可用的境界。
你肯定见过生成图像中的手部问题吧?通常这是图像生成的一个明显标志:主体会有太多的手指、太多的手,或者手部处于不可能的姿势。需要艺术家来修复这些问题。仔细观察任何生成的图像,你会发现其中的漏洞开始显现。身体部位比例失调、不可能的姿势、眼睛的方向不一致甚至颜色不同、不合理的服装设计,以及不可能实现的建筑结构。
乍一看,这些图像可能对不具备专业眼光的人来说是可以接受的,但如果你试图将其作为创作者的作品出售,就必须花费数小时的时间来进行修整,使其达到可用的标准。不过,也许这比去做一场完整的拍摄——包括道具、模特和灯光——要省力得多?毫无疑问,使用生成作品能够带来效率的提升,尽管当从生成作品开始创作时,艺术家现在更多地只需完成清理任务和合成,而不是从生成的作品开始完全创作。。
Martin Nebelong通常从他自己的艺术作品开始,然后将从KREA生成的图像拼接到他的作品中,使它们越来越接近他所追求的效果。这种方法使艺术家从头到尾都保持了控制,仅仅是加速了艺术创作的过程。他甚至探索了生成3D模型的工作流程,包括灯光处理、放大模型,并从中生成完全由他创作愿景控制的动画。他将这些生成服务作为工具,而不是像自动售货机那样使用。这是通往目的地的一步,而不是一站式的解决方案。
模型许可
目前的情况就像狂野西部,任何人都可以训练自己的LoRa Stable Diffusion模型,并在没有任何后果的情况下使用它。如果你想创建一个LoRa并将其训练成你自己的艺术风格、你所创造的角色或世界构建元素,这非常方便。你可以在这里找到一个如何操作的实用视频。这对那些希望以更快速度将自己的内容推向世界的人来说非常有用,实际上这也是最初的设计目的。
然而,也有人将模型训练在名人和著名艺术家的风格上。这引发了一些伦理问题,关于这些模型的使用方式。例如,我们是否应该允许任何人使用一个训练有素的、基于政治人物或著名演员的模型?这种模型存在极高的误用和传播虚假信息的潜在风险,而我们已经在社交媒体上开始看到这些现象的出现。最近发布的Grok-2就能从X(前身为Twitter)上的数据生成图像,几乎没有任何限制。
关于这方面的合法性和法规的执行,目前仍在全球各地的法庭上激烈争论。强烈建议不要使用这些模型来制作任何商业用途的图像、视频或音乐作品,因为法院很可能会做出有利于版权持有者的裁决。很可能的结果是,名人将拥有对基于其形象或声音训练的模型的许可权,从而能够从这些图像或音频的使用中获益。毕竟,在AI出现之前,如果你想使用他们的形象,你需要在他们的日程上预约时间,进行拍摄或录音,并且当然要支付他们作为你产品代言人的许可费用。
这些AI模型的美妙之处之一在于,你可以在不占用演员繁忙日程的情况下使用他们的形象,但他们仍然应该对谁在使用它、如何使用它拥有一定的控制权,并且从交易中获利,即使是微薄的利润。这就是许可费用的意义所在。
这也意味着,如果你基于自己的创作作品构建了模型,你应该像为客户合作许可你的作品一样,对该模型的许可进行控制。目前这还无法执行,但当相关立法通过时,生成式AI社区将会看到这一领域的变化。
AI模型的许可未来可能会成为一个大生意。客户可以提出他们想要在广告活动中使用的风格、艺术家,甚至是演员,而你可以从其来源适当获取许可,无需与实际演员或艺术家预约时间,却能够合法使用他们的形象和风格在客户的宣传活动中。这种方式似乎是一种商业上可行的解决方案,比实际预订这些人才便宜,但有利于你模仿他们的形象或表演。
更令人惊讶的是,你甚至能够在他们去世后与他们“合作”。如今在电影摄影中已经广泛使用的数字替身技术,结合用于捕捉和复制人声音的AI技术,将使我们能够在他们去世多年后仍然复制演员的形象。你可能已经在《星球大战:侠盗一号》中见过这种技术,那里还原了年轻时的公主莱娅和塔金总督的形象。
随着AI技术的发展,深度伪造(deep fakes)变得越来越普遍和可行。佛罗里达州圣彼得堡的达利博物馆就利用了这项技术,使参观者能够与1989年去世的著名艺术家萨尔瓦多·达利互动。他能够解释自己的作品、灵感,甚至与参观者合影自拍。这种沉浸式体验是一个很好的例子,展示了如何以负责任和道德的方式使用深度伪造技术来教育公众,并帮助达利接触到更广泛的观众,尤其是年轻一代。
结论
艺术家们正被推向发展新的技能,以适应那些对他们而言不熟悉的AI工具。这可能会让人感到不适,甚至难以接受。
我想鼓励艺术家们重新思考生成工具的意义。最终,它们只是工具而已。它们不了解情感或表现,只是基于所训练的数据,模拟出用户想要的可能性。它们可以制作出视觉上令人愉悦的图像,但如果没有人类的引导,它们无法赋予这些图像真正的意义。作为创作者,这是你们的新角色。
这些工具远非完美,但在适当的引导、迭代和协作下,或许可以达到足够高的质量,供艺术家用来创造出美妙的作品。人类必须将自己的情感元素注入艺术,以唤起他人的情感共鸣。否则,我们将被那些光鲜亮丽但没有灵魂的生成图像或AI音乐所淹没。社会很快会发现,他们仍然需要你们来创作那些AI无法提供的精心制作的作品,因为他们无法与那些作品建立情感连接。
创作者们的工作仍然任重道远,你们会迎难而上,还是沉溺于自怜中?当你感到困惑时,依靠创作本能,创造出世界从未见过的新作品,并与他人分享。创造出情感共鸣,作品自然会找到你。