Midjourney 新出了一款名为“ Patchwork ”的工具。
该工具是一个基于网页的空白无限画布,浏览器屏幕左侧有一个“工具箱”,其中包含各种按钮,分别标注为“角色”、“事件”、“派系”、“道具”和“随机”,以及“注释”、“图像”、“门户”、“保存”和“分享”等工具。“保存”会下载一个JSON文件,包含指向画布上创建的所有Midjourney图像的链接。Midjourney将每个画布视为一个独立的数字“世界”。
要在不同的“世界”之间切换,用户需要创建一个“门户”,即一个黑色的小圆形按钮。
要生成一个新的“世界”,用户需要在“创建”页面顶部的编辑栏中输入文本提示,并从10种不同的图像风格中选择一个或多个。
这将生成一个新的白板,包含一堆新的静态图像资产和文本框或被称为“碎片”的实体,其中包括输入框,允许用户输入新的图像或设置提示,以适应最初的世界描述,甚至可以生成全新的AI创作角色描述。
在演示直播中,角色名称自动填充为Marcus “Dizzy” Gillespie,呼应了著名爵士乐音乐家的名字。将描述拖入新的角色图像创建框中,会生成四张新的AI创作的图像。
用户可以添加新的角色框,进而创建角色的名字、特征,以及可以激发冲突的发生,为故事奠定基础。
接下来,用户可以用线条将角色连接起来,表示他们之间的关系。用户还可以编写动作序列和场景描述,每个描述都讲述一个故事。每个角色可以出现在多个图像中,这些图像可以通过一个选项聚集在一起。
用户可以将白板“分享”给其他Midjourney用户,进行协作,多个光标可以在同一共享画布上实时移动。根据Kreminski的说法,一个世界最多可以支持几十个甚至100个用户。然而,他指出,用户越多,体验可能会变得越混乱。
Kreminski表示,只有登录的用户才能查看白板(目前是这样),但未来白板可能会对非用户开放。他提到,桌面角色扮演小组已经开始使用这个功能来规划他们的活动。
他还表示,Midjourney V7将包含一个设置,允许在不同的图像中保持多个角色的一致性。
朝向沉浸式3D世界发展
Kreminski进一步透露,至少有3种不同的大型语言模型在驱动该应用程序,包括一个专门为Midjourney微调的开源模型。
最终,这似乎是一个新颖、复杂、强大且有些让人不知所措,但却非常吸引人的故事板工具。它会被作家、电影导演、游戏设计师、漫画创作者,甚至是现场剧场导演和编剧使用。
从长远来看,Kreminski表示,在“世界的细节和互动的升级方面,有一条非常明确的路径”,包括完全沉浸式的3D虚拟现实场景,但这可能还需要几年时间才能实现。
这一消息发布之际,其他AI研究人员以及谷歌等大科技公司也在寻求开发能够从简单提示或图像中创建可沉浸、可导航的3D虚拟世界的AI。
更多Midjourney更新即将推出
此外,Midjourney的创始人David Holz表示该初创公司将在接下来的几天内推出多个模型个性化模式。
目前,Midjourney允许用户对图像进行评分,以个性化他们希望在生成中看到的视觉效果,并根据个人喜好对模型进行微调。现在,初创公司将允许用户拥有多个个性化版本,并可以在这些版本之间切换。
此外,Holz还透露,Midjourney将允许用户上传并参考多个图像来指导生成。
进一步的消息是,圣诞节后(12月25日)后,Midjourney将推出视频模型和Midjourney V7 AI图像生成器,具备更强的提示理解能力。
Holz还透露,Midjourney正在研发三到四个新的硬件项目,并表示该初创公司正在“尝试扩展,成为一个完整的研究实验室……我们可能需要六个月时间来宣布所有六个项目。”