不要问AI是否能够创造艺术,而要问AI如何成为艺术
不要问AI是否能够创造艺术,而要问AI如何成为艺术

不要问AI是否能够创造艺术,而要问AI如何成为艺术

如果你想和艺术家引发争论,只需一句简单的话:“AI 能做你做的事情。”

最近,聊天机器人和文本生成图像工具的爆发,引发了作家、插画师和音乐家的担忧。像 ChatGPT 和 DALL-E 这样的 AI 工具虽然是技术上的杰出成就,但却越来越多地用于生成缺乏个性和深度的内容。艺术家们不仅担心收入损失,还担心创作过程被贬值。在一个“AI”越来越被视为平庸审美的时代,他们的担忧不难理解。

尽管 AI 工具的输出往往令人失望,但它们已成为互联网的新宠,不是因为它们创造出伟大的内容,而是因为人们热衷于制作和分享这些内容。人们喜欢用 AI 做一些搞笑或离奇的事情,例如让经典角色做出不合常规的行为。虽然艺术家担心廉价的 AI 软件会取代他们,但很多这些生成的内容并非为了省钱或商业用途,而是为了享受创作的过程,这种互动展示了 AI 艺术的另一种吸引力。

算法生成艺术有着悠久的历史,从1960年代的Oulipo文学到像《无人深空》这样的程序生成电子游戏。在生成式AI的时代,一些人通过实验或使用工具自动化传统创作流程的部分。例如,Artbreeder平台早于大多数现代AI图像生成器,吸引了艺术家们参与协作并提供精细控制。但到目前为止,许多在线传播的AI生成内容,更多依赖于新奇感或无意间的扩散,偶尔的低俗输出也让人感到好笑,但其创造性相对有限。

即便如此,与AI工具互动本身也具有一定的吸引力。生成式AI系统本质上是巨大的响应式数据库,能够以意想不到的方式筛选大量文本和图像。让它们为某个特定结果组合元素,带来一种类似于在电子游戏中构建东西或解开谜题的满足感。这并不意味着它能或应该取代传统游戏设计,但通过创作者的精心努力,它可能成为一种新的互动媒体类型的基础——一种基于几乎无限人类思想组合的超文本形式。

在《纽约客》一篇名为《为什么AI不会创作艺术》的文章中,作者泰德·姜将艺术定义为“通过大量选择所产生的结果”,以及“你与观众之间的一种沟通行为”。姜指出,AI生成的内容通常通过少量的人类决策产生大量产出,导致结果平淡、通用且缺乏意图。因此,这种内容非常适合用于垃圾信息或库存图像,因为这些场景更关注文本和图像的存在,而不是它们的实际意义。

根据泰德·姜的定义,我认为有些 AI 项目显然可以被称为艺术。这些项目通常将互动的 AI 系统作为艺术的一部分,而不仅仅是像图片、书籍或预生成的视频游戏艺术那样的静态输出。2019年,在生成式 AI 普及之前,Frank Lantz 的派对游戏 《Hey Robot》 让玩家通过语音助手探索互动,而 Latitude 的 《AI Dungeon 2》 则将早期的 OpenAI 文本模型转化为经典文字冒险游戏风格,展示了 AI 艺术的新可能。

在2022年,Morris Kolman 和 Alex Petros 推出了 AYTA bot,该项目讽刺了 AI 语言模型的炒作。这款机器人模仿 Reddit 的“我是混蛋吗?”(Am I the Asshole?)论坛,使用机器生成的回复为任何问题提供一系列流利但完全自相矛盾的建议。这个项目用幽默的方式展示了 AI 在处理复杂人类问题时的局限性。

在这些案例中,创作者通过训练系统或设置交互规则,赋予AI作品更具趣味性的互动性,避免了“AI艺术”通常容易陷入的平淡无趣感。这种互动性让观众参与选择的过程,从潜在的大量内容中挖掘出感兴趣的部分。例如,AYTA bot 之所以有趣,正因为用户可以提出自己的问题并观察机器如何回应,而不仅仅是创作者提供少量自定问题的答案。互动本质上增强了AI项目的吸引力和趣味性。

在较小的范围内,许多 AI 平台(如 ChatGPT、Gemini 和 Character.AI)允许用户通过添加命令创建自己的机器人。虽然目前从这些平台中产生的作品不多,但它们具备潜力。AI Dungeon 的自定义故事系统就很有趣,它让用户创建一个世界、角色和初始情境,供其他人探索。类似于桌游中的故事,某些输出在没有大背景的情况下也能引人入胜,但更多时候,它们像是朋友之间的共享冒险。

那么,这些内容到底算不算真正的艺术,还是仅仅是娱乐?或许这并不重要。泰德·姜质疑生成式AI的价值,强调即使是被认为是低俗的类型创作也需要技艺。数十年前,像波普艺术这样的运动就已经模糊了“高雅”与“通俗”艺术的界限。AI艺术的许多批评者正是在被称为“娱乐”的领域工作,例如网络漫画和大众小说。甚至连著名影评人罗杰·艾伯特也承认,他无法为“艺术”找到一个确切的定义。

如果有些人正在创造有趣的互动式AI艺术项目,为什么关于AI艺术的讨论没有聚焦在他们身上呢?部分原因在于,这类项目往往是最具风险的,也是AI公司最为犹豫去支持的。它们涉及更多的开放性和互动性,这使得AI公司在管理这些作品时面临更大的挑战。

虽然 ChatGPT 具备一些偶然的游戏化元素,但像 OpenAI 这样的公司通常会坚持强调,他们并不在制作由人类引导的创意或主观系统。他们的产品被定位为客观的解答机器,旨在提高生产力,而不是用于创造实验艺术。考虑到科技公司需要在高利率环境中盈利,专注于无聊但安全的商业和生产力工具可能是更合理的选择。毕竟,OpenAI 不太可能通过出售一个制作实验艺术的产品来实现其高估值的承诺。

在经历了多年内容监管不力后,科技平台如今不仅面临社会责任(即使不一定是法律责任),还需要承担用户行为带来的后果。让艺术家们挑战系统边界固然具有声誉风险,尤其是在围绕人工通用智能(AGI)的末日警告下,风险被放大了。尽管当前 AI 距离真正的 AGI 还很遥远,但复杂的 AI 模型似乎被设计成压制那些有趣且意外的使用可能性。

但结果是,复杂的人工智能模型似乎旨在压制有趣的、意想不到的用途的可能性。

大多数通用聊天机器人和图像生成器都有严格的防护措施,虽然不完美但非常严格。例如,ChatGPT 会拒绝解释“Torment Nexus”的生成,因为即使这是源于推文的虚构科幻技术,AI 也认为可能会对某人造成伤害。这些系统旨在以最少的努力生成最大量的内容。正如泰德·姜提到的,艺术家试图精细控制生成结果,但随着公司对系统的调整,效果反而越来越不令人满意,生成的内容变得更像是“无意义的填充物”。

这对设计用于搜索和商业用途的工具是有道理的(至于AI在这些领域是否表现优秀是另一回事)。然而,大型AI公司也会打压那些他们认为过于不安或有风险的互动工具开发者。比如,游戏设计师Jason Rohrer因基于已故未婚妻建模聊天机器人而被OpenAI切断API访问权限。虽然开源AI(如Stable Diffusion、Meta的Llama和Mistral的大语言模型)提供了一种潜在的解决方案,但这些系统的知名度不如其封闭的对手,且缺乏简单的入门点,如定制机器人。

无论使用哪种模型,制作互动工具的人可能无意中陷入棘手的局面。互动艺术需要将部分权力交给观众,接受意外结果,而这是小说和绘画的创作者通常不需要面对的。生成式AI系统更进一步,艺术家们也将权力让渡给用于训练图像和语言模型的庞大数据,这些数据的规模远超任何一个人类的认知能力。

游戏设计师早已熟悉“Time To Penis”问题,即在任何多人游戏世界中,玩家会迅速创造出……正如其名所示的内容。在生成式AI系统中,设计者不仅需要预见玩家会做出哪些意想不到的行为,还要预测模型如何回应——尤其是在模型经常受到其源数据中的偏见影响的情况下。这使得开发者需要时刻应对这些挑战,以避免模型输出不当或不适宜的内容。

对于基于 OpenAI GPT 的AI Dungeon来说,这个问题几乎是世界末日。这款游戏推出时提供了广泛的角色扮演选项,包括性爱场景。后来 OpenAI 了解到一些玩家用它来制作涉及未成年人的淫秽场景。在被关闭的威胁下,Latitude 努力排除这些场景,同时又不至于意外禁止一大堆其他互动。无论艺术家和设计师在创建交互式 AI 工具时做出多少决定,他们都必须接受这些决定被推翻的可能性。

同时,一些AI的支持者对待艺术界的态度更像是强硬压制者,而非合作伙伴。他们告诉创作者,必须使用AI工具,否则就会被淘汰;他们无视关于AI生成艺术骗局的担忧,甚至试图让人们将私人作品作为训练数据提供给公司。在AI系统背后的人似乎热衷于贬低艺术家的情况下,为什么任何称自己为艺术家的人还愿意使用这些工具呢?

目前,AI生成的插图和小说往往显得像人类创作的黯淡影子。然而,像聊天机器人和 AI Dungeon 这样的互动工具正在提供一种明确由人类主导的体验,这是人类设计师单独难以管理的。这些互动工具代表了人工智能与艺术结合的最积极未来方向。

鉴于创作者与AI公司之间的高调对立,容易忽略最近机器生成艺术的历史中有许多艺术家的身影。像Artbreeder的创始人乔尔·西蒙、Botnik Studios背后的喜剧演员以及参加每年全国小说生成月(NaNoGenMo)的作家/程序员,他们并不是想让自己过时,而是在利用新技术推动各自领域的边界。

互动式AI艺术还有一个独特的优势:它为用户提供了一个低风险的环境来了解这些系统的优点和局限性。AI驱动的搜索引擎和客服机器人承诺能掌握事实与逻辑,但经常无法兑现,结果是如律师用ChatGPT写简报这样的混乱情况。相比之下,AI驱动的艺术鼓励人们将这些工具视为由人类塑造的体验,而不是神秘的答案机器。AI需要艺术家——即使AI行业本身不这么认为。