生成式人工智能正在为企业开辟全新的方式,通过数字化人类化身与客户进行互动。
在SIGGRAPH大会上,NVIDIA展示了“James”,这是一款互动式数字人,能够通过情感、幽默等方式与人们建立联系。James基于NVIDIA ACE客户服务工作流程,这是一种创建自定义、超现实、交互式虚拟形象的参考设计。用户很快就能在ai.nvidia.com上实时与James对话。
NVIDIA还在这次计算机图形学会议上展示了NVIDIA Maxine AI平台的最新进展,包括Maxine 3D和Audio2Face-2D,用于提供沉浸式远程体验。
开发者可以利用Maxine和NVIDIA ACE数字人类技术,使数字接口中的客户互动更加引人入胜和自然。ACE技术支持通过AI模型开发数字人类,包括语音和翻译、视觉、智能、逼真的动画和行为,以及真实的外观。
各行各业的公司正在使用Maxine和ACE技术来提供沉浸式的虚拟客户体验。
认识数字品牌大使 James
利用检索增强生成(RAG)技术,James能够准确地向用户介绍最新的NVIDIA技术。ACE允许开发者使用自己的数据创建特定领域的头像,以便与客户沟通相关信息。
James由最新的NVIDIA RTX渲染技术驱动,实现高级逼真的动画效果。他自然的声音由ElevenLabs提供支持。NVIDIA ACE使开发者能够在构建适用于不同使用场景的头像时,自定义动画、声音和语言。
NVIDIA Maxine提升数字人在远程呈现中的应用
Maxine是一个平台,用于部署最前沿的AI功能,提升数字人类的音频和视频质量,使得可以在视频会议设备中使用实时、逼真的2D和3D头像。
Maxine 3D将2D视频肖像输入转换为3D头像,允许在视频会议和其他双向通信应用中集成高度逼真的数字人。这项技术将很快提供早期版本。
Audio2Face-2D目前处于早期试用阶段,根据音频输入对静态肖像进行动画处理,从单一图像创建动态、会说话的数字人。可以在ai.nvidia.com上试用该技术。
拥抱数字人应用的公司
HTC、Looking Glass、Reply和UneeQ等公司正在广泛使用NVIDIA ACE和Maxine,涵盖客户服务代理、娱乐、零售和酒店行业的远程呈现体验。
在SIGGRAPH大会上,数字人技术开发商UneeQ展示了两个新的演示。
第一款聚焦于由NVIDIA GPU支持的云渲染数字人类,配合本地浏览器计算机视觉,实现更好的可扩展性和隐私保护,并通过Audio2Face-3D NVIDIA NIM微服务进行动画处理。UneeQ的Synapse技术处理匿名化用户数据,并将其输入到大型语言模型(LLM)中,以提供更准确、响应迅速的互动。
第二个演示运行在单台NVIDIA RTX GPU支持的笔记本电脑上,展示了由Gemma 7B LLM、RAG和NVIDIA Audio2Face-3D NIM微服务驱动的先进数字人类。
这两个演示展示了UneeQ借助NVIDIA技术开发的数字人类如何对用户的面部表情和动作做出反应,推动虚拟客户服务体验的真实感极限。
HTC Viverse将Audio2Face-3D NVIDIA NIM微服务集成到其VIVERSE AI代理中,实现了动态面部动画和唇同步,从而提供了更自然和沉浸的用户互动体验。
全息技术公司Looking Glass在SIGGRAPH大会上展示了其Magic Mirror演示,通过简单的摄像头设置和Maxine的先进3D AI功能,在新发布的Looking Glass 16英寸和32英寸空间显示器上生成用户面部的实时全息图像,支持多人观看。
Reply推出了其为Costa Crociere的Costa Smeralda游轮开发的前沿数字人类Futura的增强版。Futura由Audio2Face-3D NVIDIA NIM和Riva ASR NIM微服务提供支持,其语音合成功能利用了包括GPT-4o、LlamaIndex用于RAG以及Microsoft Azure文本转语音服务在内的先进技术。
Futura还结合了Reply自主研发的情感计算技术,以及Hume AI和MorphCast,提供全面的情感识别。该助手使用Unreal Engine 5.4.3和MetaHuman Creator构建,搭载NVIDIA ACE驱动的面部动画,支持六种语言。Futura可以帮助规划个性化的港口访问,建议量身定制的行程,并促进旅游预订。
此外,Futura会根据客人反馈优化推荐,并使用专门创建的知识库提供城市介绍,丰富旅游行程。Futura旨在提升客户服务,提供沉浸式的互动体验,从而优化运营并推动业务增长。