Stable Doodle展示了我们将来如何与AI互动的情形。
如果您使用AI来创作视觉作品,那么有一个新的工具可以添加到您的工具库中。Stable Doodle是来自Stability的一款新工具,通过一个智能界面颠覆了大多数AI工作流程中传统的纯文本提示。
Stable Doodle可以将简单的涂鸦转化为色彩丰富、完全渲染的图像。作为Stability AI的Clipdrop生成式AI工具套件的一部分,Stable Doodle现在可以免费使用。它允许您在几秒钟内随意涂鸦任何粗略的想法,从物体的基本形状到完整的专业故事板级别的绘画,并且能够立即创建图像。这就像是与一群出色的概念艺术家和插画师一起工作的艺术指导。
它的使用非常简单:首先,在Stable Doodle的画布上用黑白色绘制任何你想要的东西。然后写一个prompt,告诉Stable Diffusion如何解释它。点击“生成”按钮,你就会看到四个不同的图像在你面前出现,以令人印象深刻的精度进行渲染。看看它是如何通过一个椅子和prompt “A comfy chair, “isometric’style” 来工作的:
或者这个非常简略的轮廓,通过prompt “Castle on a hill, winter, ‘Anime’ Style”,变成一个完美的插画,适合用于书籍封面:
它还适用于更详细的素描,如果你在绘画方面比大多数人更擅长的话。就像这个客厅素描,被转化成了“living room, comic-book style”:
这款软件不仅限于插图风格。Stable Doodle可以使用Stability的生成式AI引擎的最新版本SDXL中提供的14种风格之一,包括电影风格、奇幻艺术以及下面你看到的折纸风格的猫头鹰等:
迈向新的生成式AI用户体验
Stable Doodle并不是第一个能够将素描转化为图像的生成式AI,但它是最先进的。去年,Nvidia推出了Canvas,一款擅长创建风景图的素描到图像工具。但由于其简单性,Stable Doodle有望成为加快工作流程的绝佳工具。一旦拥有基本的素描,艺术家可以使用诸如Photoshop、Sketch或Illustrator等软件对其进行增强。在未来,这个工具只会变得更加引人注目。Stability已经发布了其代码,只是时间问题,就能看到将这一技术与专业人士使用该工具训练的自定义模型相结合。我们正接近一个时刻,每个艺术家都可以利用AI构建一个完整的工作室,并拥有一套AI助手来实现他们的创意,就像昔日的画家和他们充满学徒的工作室一样。
而且现在做到这一点也从未如此容易。通过允许视觉输入来引导提示,我们开始真正利用这些生成式工具的力量,以获得我们想要的结果。就像DragGAN一样,这是一款交互式AI应用程序,允许用户通过拖动矢量线条来改变对象的位置和视角,人的手再次成为赋予我们想象力形状的关键要素。
正如DragGAN的研究论文中指出的,“合成符合用户需求的视觉内容通常需要对生成的对象的姿势、形状、表情和布局进行灵活和精确的可控性。”Stable Doodle的素描指引不仅适用于图像编辑,还适用于图像生成。正如DragGAN的创作者Xingang Pan几周前在视频聊天所说,AI用户体验的未来是文本输入与直接手部操控对象的结合。
软件工作机制
Stability表示,Stable Doodle软件结合了两项技术,使这种神奇的功能得以实现:Stable Diffusion XL和T2I-Adapter。T2I-Adapter是由国内强大的综合企业腾讯旗下的高级研究中心开发的算法。
TSI-Adapter添加了参数,用于指导扩散模型生成所需的输出。对于Stable Doodle来说,该算法为SDXL提供了“补充指导”,使模型能够理解素描的轮廓,并将该理解与文本提示相结合。
据Stability的一位发言人表示,Stable Doodle是他们将Clipdrop打造成爱好者和专业人士的工具箱战略的又一步,旨在通过生成式AI模型以简单的方式编辑和创建图像。该组织将在未来不断增加更多这样的工具。“我们正在不断探索模型的组合,以提供新的体验”,一位发言人表示。
Stable Doodle现在可以在Clipdrop的网站和移动应用上使用,该应用适用于iOS和Android平台。即使不注册登录,它也可以免费使用,但有每日使用配额限制,具体配额Stability尚未明确说明。与其他生成式AI应用一样,您可以使用积分来跨越限制并获得更快的处理速度。