Meta 的Movie Gen 是视频叙事的未来还是对创造力的威胁?
Meta 的Movie Gen 是视频叙事的未来还是对创造力的威胁?

Meta 的Movie Gen 是视频叙事的未来还是对创造力的威胁?

10月,Meta推出了其最新的生成式人工智能模型Movie Gen,该模型能够根据用户简单的提示生成逼真的视频片段。继Make-A-Scene和Llama AI图像模型之后,Movie Gen成为Meta在生成式人工智能领域的第三次重大尝试。借助这一新工具,用户只需描述想要创建的场景,即可生成长达16秒的视频片段和长达45秒的音频片段。

Meta创始人兼首席执行官马克·扎克伯格在Instagram上发布了一段令人着迷的视频,展示了该模型的功能。视频中,他正在一间霓虹灯闪烁的健身房里做腿举训练,而腿举的对象竟是鸡块。“有了Meta新推出的MovieGen AI模型,每天都能成为腿部训练日,它还能创作和编辑视频。明年即将登陆Instagram。”扎克伯格在Instagram上写道。

Meta一直在斥巨资打造一个以人工智能为动力的生态系统。扎克伯格最近表示,Meta计划到2025年用人工智能取代中级软件工程师,这标志着该公司在软件开发方法上的重大转变。他还宣布,Meta将从第三方事实核查系统过渡到社区笔记模式,这一模式受到埃隆·马斯克X平台做法的启发。

然而,Meta推出的并非每一项人工智能计划都受到了公众的热烈欢迎。在遭到强烈反对后,该公司最近从Facebook和Instagram上删除了由人工智能生成的角色账号。批评者称这些账号“令人毛骨悚然”且“没有必要”,许多用户对其逼真的特性和可能传播错误信息或促成有害互动的潜力感到不安。然而,Meta将此举归因于一个技术问题,即用户难以屏蔽这些账号。该公司澄清说,这些人工智能角色是其测试在平台上整合人工智能生成个人资料实验阶段的一部分。

Meta将Movie Gen描述为一组人工智能模型的集合,其中最大的是拥有300亿参数的文本到视频模型。该模型能够生成逼真的视频以及音画同步的视频,提供完整的多媒体体验。这一发展正值人工智能生成的动态图像和视频内容需求激增之际。但Meta并非视频生成式人工智能领域的唯一参与者。OpenAI正在开发的Sora和谷歌的Veo也承诺将为视频创作带来独特的功能和应用。

例如,OpenAI的Sora能够生成长达一分钟的视频,这相较于Movie Gen的16秒限制有了显著的提升。同样,谷歌的Veo视频提供了精细的创意控制。该人工智能能够创建具有电影效果的高清视频,如延时摄影或风景的航拍镜头。虽然Sora尚未向公众开放,但谷歌的Veo已经向部分创作者推出。

让人类创造力民主化还是淡化艺术?

在公司网站上发布的一篇研究论文中,Meta声称,在电影的整体质量、连贯性、动作自然度和逼真度方面,Movie Gen的表现优于包括OpenAI的Sora、Runway Gen 3以及中国AI视频模型Kling在内的竞争对手。

Meta在一篇博客文章中表示:“当由人类进行评估时,Movie Gen在行业中的类似模型中表现优异,涵盖图像、音频、视频和3D动画等各项任务。正净胜率意味着人类更喜欢我们模型的输出结果,而非行业内其他竞争模型的输出结果。”

虽然Meta将Movie Gen定位为视频制作的民主化工具,让没有传统技能或资源的人也能表达自己,但这一发展可能导致低质量的AI生成内容泛滥。过去几年,人们越来越担心AI生成的视频可能会掩盖人类的创造力,使得保留个体独特的艺术愿景变得更加困难。电影制作人、摄影师和艺术家尤其担心生成式AI工具的兴起会影响他们的生计。

“无论有没有AI,我认为观众并不在乎。”AI驱动的视频创作平台Invideo的创始人兼首席执行官Sanket Shah说,“AI现在只是我们手中的另一种工具,可以帮助创作者更快地提取价值,而无需深厚的资源。在未来两年内,世界上大多数视频的创作流程中都将使用AI或采用AI工具。”(Meta在一篇博客文章中表示,Movie Gen不是人类创作者的替代品,而是增强他们创造力的工具。)

虽然好莱坞编剧在2023年终于赢得了他们长期以来为在娱乐行业使用AI设置更多限制的斗争,但许多人认为这一成果只是权宜之计,而非全面解决方案。

Meta应对AI生成虚假信息的策略

根据Forrester的《2024年美国机构内部生成式AI现状》报告,83%的美国机构高管在使用AI生成的内容时担心版权侵权等法律问题。Meta对AI生成内容的潜在滥用一直持谨慎态度。该公司表示,已实施安全保障措施来解决安全问题,包括在通过Movie Gen生成的AI视频中添加可见和不可见的水印。Meta表示,这些措施旨在防止误导性或有害内容的传播,考虑到深度伪造和AI驱动的虚假信息的泛滥,这是一个关键问题。

其他AI提供商也在采取措施降低因训练扩散模型的数据和AI工具生成的内容而带来的法律风险。例如,微软已扩展了其Copilot产品的赔偿政策,Getty Images为其使用生成式AI解决方案的客户提供“无限额赔偿”,而Google的Vertex AI Studio则为训练数据和生成的输出提供赔偿。

然而,Meta在训练Movie Gen所使用的数据方面略显含糊,仅表示该模型是使用“获得许可和公开可用的数据集”混合训练而成的。该公司没有完全披露数据来源或提供更多细节,这暗示它可能使用了数百万个从Instagram和Facebook上抓取的视频。

“AI生成的内容已经超出了我们所能理解的真实、模仿或模仿的范畴。很清楚的是,有AI生成的内容被故意用来欺骗。至少,我们需要有措施和系统来提供关于AI生成的视频、图像及其数据来源的上下文,”生成式AI内容检测平台Hive的首席执行官兼联合创始人Kevin Guo说。

Meta的做法凸显了整个行业面临的一个更广泛的挑战:在AI创新与道德和法律责任之间取得平衡。随着AI军备竞赛的加速,未来AI项目的成功似乎取决于能否在执行透明度方面和保障措施方面加强监管——这两者对于赢得公众信任都至关重要。最终,科技领导者必须确保这些进步成为一股积极的力量,而不是伤害的来源。