像DALL-E或Midjourney这样的AI程序能够执行创意任务吗?
像DALL-E或Midjourney这样的AI程序能够执行创意任务吗?

像DALL-E或Midjourney这样的AI程序能够执行创意任务吗?

我们正目睹着图像生成过程的重大转变。最近机器学习和AI的涌入和增长引发了有关创意过程如何通过技术演化和发展的问题。像DALL-E、DALL-E 2和Midjourney这样的系统是经过训练的AI程序,它们能够根据文本描述生成图像,使用了一组文本-图像配对的数据集。这些多样化的能力包括创建拟人化的动物和物体版本,以合理的方式组合不相关的概念,并对现有图像应用变换。

DALL-E及其类似系统能够为语言结构构成的各种句子创造出合理的图像。DALL-E拥有某些3D渲染引擎的能力,但不同之处在于输入的性质。对于3D渲染,输入必须以完全详细的方式指定,而DALL-E通常能够“填补空白”。它还可以独立控制少数对象的属性。

其中最令人兴奋的特点之一是能够将不相关的概念结合起来。这种能力对于建筑和设计领域具有潜在意义,因为它让建筑和产品设计能够从看似不相关的概念中汲取灵感。AI生成模型鼓励设计师以新的视角探索更多的设计可能性,因为它缩短了想象力和执行之间的时间。它们提供了一种可访问的方式,可以处理数据并生成对创意问题解决方案的富有想象力的变化。

一些研究人员将这些称为“人工机遇之神”,它们最大程度地增加了机遇,扩展了创意能力的范围,超越了传统方法。建筑师已经开始使用这些工具来探索城市规划和现有空间可能性等复杂问题。其他人将建筑关键词与千篇一律的当代设计、流行文化参考和各种艺术风格相结合,以设计建筑物或简单地探索设计趋势和技术性质。

尽管这些模型存在一些限制,但该领域正以前所未有的速度发展。最近,苹果发布了Gaudi,一个“神经建筑师”,它将这一过程推进了一步,可以从文本提示(如“上楼”或“穿过走廊”)创建3D场景。很难预测这些发展将带领我们去何处,但它们的影响已经可以感受到。在建筑和设计领域,这些可以被看作是探索、优化和快速测试创意设计的强大工具。