Viggle 创建可控的 AI 角色,用于表情包和可视化创意
Viggle 创建可控的 AI 角色,用于表情包和可视化创意

Viggle 创建可控的 AI 角色,用于表情包和可视化创意

你可能不熟悉Viggle AI,但你可能已经见过它制作的病毒式表情包。这家加拿大AI初创公司负责制作了数十个视频,将说唱歌手Lil Yachty在夏季音乐节上跳舞的画面进行了混剪。在其中一个视频中,Lil Yachty被替换成了华金·菲尼克斯饰演的《小丑》。在另一个视频中,耶稣似乎正在激励观众。用户制作了无数个版本的这些视频,但其中一个AI初创公司是推动这些表情包的核心。而Viggle的首席执行官表示,YouTube视频为其AI模型提供了支持。

Viggle训练了一种3D视频基础模型JST-1,声称具备“真正的物理理解”。Viggle的首席执行官Hang Chu表示,Viggle与其他AI视频模型的关键区别在于,Viggle允许用户指定角色的动作。其他AI视频模型往往会创建不符合物理规律的不现实角色动作,而Chu声称Viggle的模型有所不同。

“我们本质上是在构建一种全新的图形引擎,但完全依赖神经网络。”Chu在采访中表示,“我们的模型与现有的视频生成器大相径庭,后者主要基于像素,不真正理解物理结构和属性。我们的模型旨在具备这种理解,这就是为什么它在可控性和生成效率方面有显著优势。”

例如,要创建小丑版的Lil Yachty视频,只需上传原始视频(Lil Yachty在舞台上跳舞)和一个要呈现该动作的角色图像(小丑)。此外,用户还可以上传角色图像和带有动画指令的文本提示。第三种选项是,Viggle允许用户仅通过文本提示创建全新的动画角色。

但表情包只是Viggle用户的一小部分;Chu表示,该模型在创意领域作为可视化工具得到了广泛应用。这些视频虽然远不完美——画面不稳定,面部表情缺乏生动——但Chu称其在电影制作人、动画师和视频游戏设计师中已经证明了其有效性,可以将他们的创意转化为视觉效果。目前,Viggle的模型仅能创建角色,但Chu希望未来能支持更复杂的视频制作。

Viggle目前在Discord和其网页应用上提供了一个免费的有限版本AI模型。公司还提供了一个价格为9.99美元的订阅服务,以增加使用容量,并通过创作者计划为一些创作者提供了特别访问权限。首席执行官表示,Viggle正在与电影和视频游戏工作室讨论技术授权事宜,同时也看到独立动画师和内容创作者的广泛应用。

周一,Viggle宣布获得了由Andreessen Horowitz领投、Two Small Fish参与的1900万美元A轮融资。该初创公司表示,这轮融资将帮助Viggle扩大规模,加快产品开发,并扩充团队。它与Google Cloud等云服务提供商合作,训练和运行其AI模型。这些Google Cloud合作通常包括访问GPU和TPU集群,但通常不包括使用YouTube视频来训练AI模型。

训练数据

“到目前为止,我们一直依赖公开的数据。”Chu回答道,这与OpenAI首席技术官Mira Murati关于Sora训练数据的回答类似。

当被问及Viggle的训练数据集中是否包括YouTube视频时,Chu直接回答:“是的。”

这可能会引发问题。4月,YouTube首席执行官Neal Mohan告诉彭博社,使用YouTube视频来训练AI文本到视频生成器将是对平台服务条款的“明显违反”。这些评论是在讨论OpenAI是否可能使用YouTube视频来训练Sora的背景下作出的。

Mohan澄清道,Google(YouTube的母公司)可能与某些创作者签订了合同,以在Google DeepMind的Gemini训练数据集中使用他们的视频。然而,根据Mohan和YouTube的服务条款,在未获得公司许可的情况下,采集平台上的视频是被禁止的。

Viggle利用了各种公开来源,包括YouTube,以生成AI内容。我们的训练数据经过精心策划和优化,确保在整个过程中遵守所有服务条款。我们优先保持与YouTube等平台的良好关系,并承诺遵守其条款,避免大规模下载和任何涉及未经授权的视频下载的行为。

这家初创公司与其他使用YouTube作为训练数据的公司一样,处于一个灰色地带。报告显示,许多AI模型开发者,包括Nvidia、Apple和Anthropic,使用YouTube视频转录或剪辑进行训练。这在硅谷并不是什么秘密:每个人可能都在这样做。实际上,罕见的是有人公开承认这一点。