好莱坞演员抵制AI,但AI视频初创公司却看到了数字人的创造潜力
好莱坞演员抵制AI,但AI视频初创公司却看到了数字人的创造潜力

好莱坞演员抵制AI,但AI视频初创公司却看到了数字人的创造潜力

好莱坞的演员和作家目前正在罢工,其中最大的担忧之一是生成式人工智能对他们行业和工作的影响。在上周的新闻发布会上,美国电视和广播艺术家联盟(SAG-AFTRA)工会主席弗兰·德莱瑟表示,人工智能对创意专业构成了“存在性威胁”,所有演员和表演者都应该有合同条款来保护他们的身份和才华,以防止未经同意和付费就被利用。

然而,包括Synthesia、Hour One和Soul Machines在内的一群生成式人工智能视频初创企业并不这样看。他们认为,AI生成的化身或数字人物充满了强大的商业、好莱坞和名人创意潜力,前提是他们获得了对其AI肖像的同意。

应对传统视频制作的挑战

例如,去年11月,合成媒体公司Hour One的战略主管娜塔莉·蒙比奥,她表示不喜欢“deepfakes”这个词。“Deepfake暗示了对合成媒体和生成式人工智能的未经授权使用,而我们从一开始就得到了授权,”她表示。

她解释说,企业可以利用合成媒体(虚拟人物)来解决传统视频制作的昂贵、复杂和不可扩展的挑战,尤其是在视频内容需求似乎无止境的时候。此外,合成媒体使企业能够快速轻松地提供不同语言的内容,并大规模制作宣传视频内容。

例如,总部位于洛杉矶的初创公司Soul Machines今天刚刚宣布与韩流明星Mark Tuan(韩国男团GOT7的成员)合作推出“数字马克”。该公司称这是“首次将名人形象与GPT关联”,使Tuan的社交媒体追随者(有3000万粉丝)能够与“他”进行关于几乎任何话题的一对一对话。

新闻稿称,随着韩流音乐在全球范围内的粉丝持续增长,Tuan的数字双胞胎将“使他能够使用多种语言进行对话——首先是英语,然后在不久的将来还将增加韩语和日语的语言功能。”

Synthesia CTO称数字人类是视频创造力的“自然发展”

Jon Starck,伦敦初创公司Synthesia的首席技术官,该公司最近以其由AI技术驱动的平台,在帮助企业从纯文本生成宣传或教育视频方面实现了10亿美元的估值,并获得了Nvidia的资金注入。他表示,AI驱动的数字人类拥有创意和高效率的潜力,不容忽视。

他说:“视频是一种非常富有创意的事物。它是一个讲故事的工具,非常视觉和引人入胜。”但他补充道:“整个视频制作过程可能是你能想象到的最缺乏创意的事情。”有了当今的AI驱动视频生成机会,他补充说:“每个人都成为了一个伟大的故事讲述者。”

Starck表示,这是从以前在电影制作中进行的AI生成尝试的“自然发展”,并表示未来可能会有一整部电影由合成数据制作而成。

这是一个大胆的声明,但Starck在数字人类领域已经工作了20年,当时“没有人听说过计算机视觉”,他当时在电影行业工作,为电影制作中的技术艺术家引入了3D计算机视觉技术。

他说:“我们现在处理的问题与20年前完全相同。” “以前我有八台摄像机,现在我有78台摄像机。现在有24兆像素的摄像机。现在我们有能力解决我以前无法解决的问题。”

利用演员获取高保真度人类表现的最佳数据集

Synthesia的研究人员在解决一个棘手的计算机视觉问题方面取得了重大进展:以高保真度表现人类动作,这是从电影制作和电子游戏到视频会议等应用的基本构建块。例如,现在,像Synthesia这样的AI工具是二维的,并且不显示一个完整的360度视角下的人类全身运动,就像在电视广告或电影中看到的那样。

为了缩小与生产级视频质量之间的差距,Starck和他的团队最近发布了名为HumanRF的AI研究项目,它可以从多视角视频输入中捕捉到人类全身运动的外观,并能够从新颖的未见过的视角进行回放。

为了应对这一挑战,Synthesia的研究人员需要创建一个高保真度的有衣着的人类运动数据集,这需要具有讽刺意味的是真实的演员。

该公司通过访问英国一家工作室中真实演员的动作和表演来创建名为ActorsHQ的数据集,该数据集包含39,765帧的动态人类运动,使用了专有的多摄像头捕捉系统进行多视角视频捕捉。

这些演员“希望回来成为潜在的3D合成角色的未来一部分,”Starck说。

在被问及好莱坞罢工的编剧和演员的抱怨时,Starck强调,Synthesia不从事电影业务。“我们不会替代演员,”他说。“我们不会替代电影创作。我们只是用文本进行沟通。我们将合成视频带入企业工具箱。”

他补充说,从个人角度来看,作为一名在视觉效果领域工作过的人,他将每一项发明视为一种新的促进因素。