有手就行?AI 图像编辑技术 DragGAN 推出,拖动即可P图
有手就行?AI 图像编辑技术 DragGAN 推出,拖动即可P图

有手就行?AI 图像编辑技术 DragGAN 推出,拖动即可P图

由马克斯・普朗克计算机科学研究所、MIT CSAIL 和 Google 的研究者们研究了一种 新的 AI 图像编辑技术 DragGAN,不仅可以通过简单的点击和拖动来改变汽车的尺寸或将笑容转换为皱眉, 还可以像操作3D模型一样旋转图片中的主体——例如改变某人的面朝方向。一个演示甚至显示用户通过几次点击就能调整湖面上的倒影和山脉的高度。

人工智能图像生成工具使我们能够以前所未有的方式编辑和操控图像。不同于传统的像素级图像编辑工具,如Photoshop,这些人工智能工具可以理解图像中的对象及其空间关系,并在保留对象细节的同时进行编辑。用户不再需要手动移动各个像素来实现想要的效果,人工智能可以自动重新生成图像达到编辑后的样子。

以图像旋转为例,Photoshop可以实现二维旋转,但无法自动填补旋转后的空白区域或遮挡部分。人工智能图像工具可以分析图像中的三维空间关系,在旋转图像的同时生成从未出现过的新图像区域,达到真实的三维旋转效果。这使得图像编辑变得前所未有的便捷直观,用户只需要准确表达想要的效果,人工智能便可以进行图像重构实现编辑要求。

DragGAN模型的两个关键功能:1)可以生成被遮挡区域的图像内容;2)可以根据图像对象的刚性属性变形图像。这两个功能使得DragGAN实现的图像操控达到前所未有的真实感和逼真度。

这种新的图像生成方式代表了人工智能对图像语义及空间关系理解的进一步深化。人工智能不再受限于像素级操作,而可以直接理解图像对象的属性与结构,根据用户的操作转变相应目标的形状、空间位置以实现编辑效果。这使图像编辑变得前所未有的直观简捷。

DragGAN模型的优势,即相比其他人工智能图像生成方法,它提供了更加灵活精准且易于操作的界面。尽管该技术目前还处于演示阶段,很难进行全面评估,但它展现出的图像操作便利性已经代表了该领域技术的重要进步。