人工智能幻觉对创意者来说是一个福音
人工智能幻觉对创意者来说是一个福音

人工智能幻觉对创意者来说是一个福音

设计师 Colin Dunn 喜欢看到基于人工智能的创作图像服务(如 Midjourney 和 OpenAI 的 Dall-E)偶尔会出现失误,产生一些随机的作品。 比如,当他们对一个关于群体一致延续的图像请求时回应这让Dunn想起了与同事一起尝试各种奇特想法的时光,直到意外地找到了正确的方向。

Dunn 的创业公司 Visual Electric Co. 开发了一个新颖的网络界面来利用这一过程。传统的文本到图像生成器通常在聊天窗口中输出单一的图片,但在 Dunn 的应用中,结果输出被保存在行修改中,并排列在它们或下方,形成了一个画廊。这种方式产生了一个草稿的拼贴,使用户能够根据AI如何解读他们的连续请求来探索各种创意想法,无论好坏。

Dunn 表示,这种工作流旨在激发“广泛而混乱的探索”,他是一位曾在 Dropbox 和 Facebook 工作的设计师,他位于加利福尼亚州索萨利托的创业公司得到了红杉资本的支持。该公司更注重让人工智能以出人意料的方式自由运行,而不仅仅是在需要很少的点击次数中达到预期的结果。该应用程序还提供自动重写提示、更加不同的描述、情感美学调整和计算机为您的文字阅读程度调整等工具。

因此,Visual Electric的目标之一是鼓励“幻觉”,这是一个伪科学术语,指的是AI系统在其自己的训练数据中打乱并编写内容。自ChatGPT在2022年底公开发布之前,工程师他们一直试图阻止聊天机器人产生幻觉,但聊天机器人及其类似产品仍然倾向于在回答用户查询时混入编造的“事实”。例如,当被问及60分钟节目中的通货膨胀时,谷歌的吟游诗人创造了听了一系列听起来真实的经济书籍,包括意图的摘要。在集成了OpenAI技术后,Bing参与了一些臭名昭著的交流,其中威胁勒索和向早期评论家表达了爱意。这些而非真实可预测的答案不仅给人们留下了机器人有自己的想法的印象,还给人们留下了他们已经开始失去的想法的印象。

如果人们将依赖像驱动ChatGPT的大型语言模型进行在线搜索、编写或其他应用,这样的幻觉可能会成为一个潜在的终止条件。当2023年公众对AI恐慌关系恐慌时,技术与事实的矛盾引发了关于无数制造计算机可能威胁到真理本身的声明。

AI系统产生幻觉的倾向已经成为性能的一个基准。Galileo是一家帮助企业客户优化他们的生成式AI应用的公司,已经推出了一个名为幻觉指数的指标,该指标评估了如Hugging Face、Meta Platform和OpenAI等公司的AI系统的正确性。伽利略的主张Vikram Chatterji表示,金融到医疗等各行各业的公司特别希望其面向消费者的AI产品拥有“极限的控制”。他解释说: “他们最关心的问题是:‘如果我发布了这个东西,它会胡言乱语吗?这可能会损害我们的品牌、我们的股票,对世界也非常不利。’”

由于现代人工智能的复杂性,专家们不确定这个问题是否可以完全修复。但相反,也许并非所有问题都需要修复。“有时幻觉确实是一个功能;这就是创造力,有时它是一个缺陷,”当被问及这一缺陷的后果时,微软总裁萨蒂亚·纳德拉(Satya Nadella)最近表示:“我们都在努力提高这方面的水平。”

在未来的一年里,越来越多的开发者都希望能够利用这些偏见和幻想中的魔力。邓恩将其比作一些人类可能冒险使用化学物质来触发他们的艺术暗示的方式。“LSD之旅是一个非常贴切的比喻,”他开玩笑说,“如果模型完全按照你的要求执行,那它真的不是一个创意伙伴。”

Runway AI Inc.的首席技术官Anastasis Germanidis表示,某种程度上的“现实性”是必要的——一个请求的猫视频确实需要展示一只猫,而不是一只狗——但他的团队并并不想限制幻想的输出。对于紧张的提示,杰曼迪斯说跑道有时会“填补空白”,“给模型更多的自由度,来想象一下缺陷或用户没有明确提供的属性。”

他还发现,创意专业人士正在尝试与节目表演,提供精细的提示以激发现实的视觉。导演超保罗·特里洛就在《跑道》中制作了一部获得悲伤的短片,利用引擎的更迷幻的幻觉效果,表演地铁下沉和面部特征像油画动画一样移动的场景。正是这些缺陷使得它如此引人入胜。在与《纽约客》的一次采访中,描述了这部名为《谢谢你不回答》的电影时,被名为“部分爱德华·霍珀,部分大卫·林奇”的特里洛说,人工智能做出了他不会做的选择,让人感觉就像在梦电影中飞翔。

其他开发者试图用微量剂量来限制他们的人工智能系统。在世界人工智能帮助视频游戏开发者构建互动计算机角色时,已经开发了一个“第四墙”功能,角色限制人类玩家的反应方式。这些人工智能角色被赋予了个性特征、情感、记忆和抱负,这可能会导致人们进入胜出和独特的行为。但联合创始人和产品负责人凯兰·吉布斯表示,如果他们离问题太远,可能会破坏沉浸感。《星球大战》中的一个游戏中的机器人应该能够编造一个关于其家乡珍珠的个人背景故事,但不应该错误地否认达斯·维达是卢克·天行者的父亲。“扩大世界和破坏世界之间有一个平衡点, ”吉布斯说道。

然而,他指出,一些开发者在规模较小的《龙与地下城》风格的游戏中关闭了第四墙功能,这些游戏的宇宙并不是由几十年的记录规范所决定的。看到游戏制作者在制作过程中取消了设置,使用幻觉来构建新的故事线和支线任务。“你有一个作家说,‘我对这个世界有一个初步的想法。我只是要在其中创建角色,开始与他们交流,看看会得到什么,’”吉布斯说道。

从这个意义上说,不是幻觉的接受度在改变,而是其定义在变化。创意人士更多地从拟人化的角度来谈论它,而不是作为一个制造意象的机器。处理机器生成的歌曲或营销活动时出现的小问题可能正是用户所期望的。

Visual Electric 的 Dunn 在生成 AI 图形时经常遇到情况。随着指令变得越来越长,计算机最终会打消他的这种想法。“你的第一反应是‘这太糟糕了,这不是我’但是,几十年后,他通常会意识到:计算机是对的。