为了发掘生成式AI的创新潜能,同时对这些系统加以控制,我们需要一种多学科的方法,将产品设计与AI、机器学习以及其他数据驱动方法相结合。
生成式AI技术,如大语言模型(LLMs)及其应用,现在正在走向主流:OpenAI 和 ChatGPT 正在引领潮流,Meta 和 Alphabet 也加入竞赛,众多其他参与者紧随其后。
在B2C和B2B领域,不同的使用案例和业务情况受到热情探索,从更智能的搜索到类似聊天的购物体验,从新闻内容创作和个性化营销到为财富管理、协作和教育提供AI辅助工具。
与此同时,这股新的AI驱动创新浪潮也引发了各种担忧,从即将来临的人工智能启示到更加深思熟虑的考虑,即内在偏见、恶意用途和数据安全所带来的影响可能会对个人、企业和社会造成广泛的伤害。
不容置喙:这种快速发展将需要新的思维和方法来进行产品设计。例如,我们探索和发现新的解决方案空间的方式,定义体验并制定客户体验要求的方式正在迅速改变。
生成模型超越了聊天机器人
为什么生成式AI技术如LLMs如此重要?从产品设计的角度来看,我们需要更深入地了解它们的本质,才能得到完整的画面。
LLM是一种基于神经网络的通用AI,能够解释和生成自然语言文本。这些模型预测一个词会跟在另一个词后面(或者在生成性想象中,一个像素在另一个像素旁边会有何种意义)。为了在不同的上下文中有效地进行预测,这些生成模型已经被喂养和训练了大量的内容数据,例如在线文本材料。
然而,生成语言模型的应用和潜在用途超越了解释和生成文本。当模型应用于新的用例和任务时,生成模型具有可以发现的新能力。值得注意的是,从其核心来看,LLMs在不断学习和更新信息基础设施,这些基础设施可以用于动态信息处理、操作、管理和检索。
LLM驱动的体验的最终目标不是今天随处可见的聊天机器人体验,而是生成模型可以作为平台,为各种动态体验提供动力,将不同类型的交互元素和内容相结合,从文本和图像到链接、视频、可视化等等。以人为中心的产品设计在以影响力和可持续的方式利用这些强大技术方面发挥着关键作用。
无法控制的生成式AI超能力
生成式AI技术可以赋予您创造不同类型内容和客户体验的超能力。然而,这些力量并不容易控制。预测或控制生成模型的输出和行为并不是一件简单的事情,有三个主要原因。
这些基础设施及其内部运作部分是难以理解和无法访问的黑匣子。无论是对现有生成模型应用和服务的开发者还是用户而言都是如此。例如,ChatGPT的用户无法直接影响模型本身的确切动态或运作方式。
在生成模型中,信息或其结构并不稳定或静态,而是非常动态的。基本上,生成语言模型内的所有信息都可以在非常精细的级别上进行操作和改变。与此同时,随着模型本身的迭代和变化,其行为以及例如对类似输入的响应也会发生变化。LLMs并不提供一个静态的基本真相源(甚至不提供一个呈现),而是信息片段及其关系可以无限地改变、组合和混合。
由于其动态性,如ChatGPT、Bard或Character AI等生成模型可能会虚构内容。当预测给定上下文中的下一个内容时,LLMs可以提出完全新的词汇和句子组合,从而创造与我们共享现实毫无关联的事物。的确,生成模型可以虚构人物、艺术作品、工作历程、公司、时尚产品等等。这些虚构的输出通常被称为幻觉。对于某些用例和体验,生成模型的这种创造力是很有益的,但对于某些情况,可能会造成灾难。
因此,没有一种一致或正确的方法来控制或引导生成式AI。从微软到英伟达等不同公司都提出了管理和监督生成模型的指导方针。然而,这些现有框架都不能保证对LLMs的动态和创造性力量具有完全可预测的控制。
鉴于此,对于产品设计来说,最关键的是在创造性力量和控制之间找到平衡,以创造包容、一致且有意义的客户体验,从而使业务受益。
掌控超能力的方法
寻找平衡的方式需要融入到设计和开发以LLMs为动力的产品和体验的多学科过程中。产品设计需要:
- 帮助组织评估哪些客户问题和业务案例可以从由生成式AI驱动的解决方案中受益。
- 通过深入理解客户和机器代理之间的互动以及相关的数据流,将生成式AI黑匣子转变为一个水族馆。
- 通过保持以人为中心、安全和可靠的人工智能体验,引导客户。
以LLM为例,还是不以LLM为例
像LLM这样的生成模型并非能够在一夜之间改变一切的万能药。您需要有意识地探索、认知和评估哪些类型的客户问题和用例可以具体且安全地从利用生成式AI中受益。
准备好循序渐进地寻找最适合的用例和体验,然后以务实的以客户为中心的方式对其进行迭代。
以开放的心态探索解决方案空间及其机会,超越聊天机器人的范畴。及早地映射风险,并考虑防范措施。
- 在您特定的用例和体验中,可能会产生哪些偏见?
- 使数据使用对客户透明的最佳方式是什么?
- 在体验本身中引入什么样的安全机制,以保持客户的控制,并抑制AI的创造力?
与您的工程和应用科学同事密切讨论并共同努力找出潜在的解决方案,以理解不同的风险场景和技术可行性,识别潜在的低 hanging fruits(即易于实现的举措)。
在这个阶段,产品设计、数据科学、工程和业务应该紧密合作,确保事情首先由客户和业务驱动,而不是让技术本身来主导。
在初步定义了用例和首选客户体验场景之后,设计和开发工作应该并行进行,以实现持续的学习和迭代。
揭开黑匣子的神秘面纱
提示工程是当今的热门话题之一。为了开发由生成式AI驱动的引人入胜的客户体验,产品设计师需要深入研究这门新兴的艺术。
首先,您需要了解的是,没有一种特定的方法可以确保您的提示在您的用例和体验中得到正确的运用。其次,唯一的不变是变化。例如,当您选择的LLM模型版本发生变化时,您之前微调过的提示可能不再按预期工作。
从产品设计的角度来看,提示需要从战略和战术的角度来考虑。
首先,您需要具体地确定什么样的初步提示和规则,以及额外的信息、系统和数据集需要支持您特定的客户体验和业务案例。提示(几乎总是)只是方程式的一部分。
其次,您需要思考一个框架,使您能够系统地设计、开发和评估客户体验和提示,并进行调试。
提示分为两个层次。一个是对客户可见的层次,另一个是机器代理解释客户输入并潜在地使用该解释调用其他系统或利用其他数据集的层次。
例如,您正在设计一个财富管理助手。在提示的第一个层次,您需要考虑允许客户与助手互动的方式,以及助手可以为他们提供哪些潜在主题。您可以允许客户向财富管理助手询问有关最新流行音乐的信息,但助手可能会回答,根据您限制的主题,他们没有提供流行音乐建议的能力。
在提示的第二个层次中,例如,客户发出了一个问题,希望获得有关特定信息技术领域的投资建议。您已经提示助手可以就这个特定主题提供建议,使用特定的语气以及结合自然语言和基于数据的信息图表的特定内容呈现公式。
从产品设计的角度来看,系统需要正确解释客户的输入,以便以简洁明了的自然语言和图形形式表达出来。机器代理需要接受客户输入,并能够在幕后调用正确的附加系统,例如用于创建信息图表的数据库。如果机器代理错误地解释了客户的输入,未能调用允许其生成信息图表的数据库,那么与客户问题相关的恰当答案将无法出现。
产品设计需要意识到这些关键信息流以及它们的动态,以便为控制体验创造更多的可见性。为了推动设计和开发,您应该创建一个双层框架,允许您评估客户与LLM驱动的代理之间的交互质量,并评估用于将机器代理与正确的后台系统连接的客户输入的解释。
为了有效地进行提示和质量评估,需要为团队建立快速学习和务实迭代的机制。做好设计、开发、测试和迭代的准备。边缘情况、故障和异常情况将浮现出来,其中一些只有通过具体尝试才能发现。因此,准备尽快将体验的第一个版本呈现给选定的一组真实客户,以发现错误案例和客户体验痛点,从而使您能够务实地迭代解决方案。
这并不意味着产品设计师应该转变为工程师或应用科学家。但同样,产品设计应该与工程和数据科学紧密合作,开发适当和有效的提示策略及其端到端的评估方法,以确保客户体验朝着正确的方向发展。这可能需要建立自动化和人为参与的客户体验测试框架,帮助发现在某些领域可能会出现体验回归的情况,而在其他领域可能会有所改进。
引导客户创造包容性体验
生成型模型可以用来为客户提供全新类型的体验,引入了客户与产品和内容互动的新方式。管理客户期望并以易理解的方式引导他们变得至关重要,以确保新体验确实在他们的任务中帮助客户。同样,识别出最重要的客户接触点,例如可以为用户界面和交互选择、消息传递和与提示同步的反馈循环提供信息。
在考虑用户界面和交互解决方案时,要握住客户的手,让他们以自己的步调学习。注意客户如何开始以及体验本身如何为他们的成功做好准备。设计快捷方式和安全控制手段,例如允许客户退出死胡同的对话,或确保机器代理的幻觉不会妨碍客户的兴趣、意图和需求。
在创建现实中的客户体验时,始终应将可靠性、安全性和安全性考虑放在首位。防护措施以及相关的面向客户的解决方案应该是与熟悉数据偏见和可访问性主题的专家进行深入合作的结果。
产品设计正在开始超越其更传统的领域,如用户界面、用户体验和信息架构设计。为了发掘生成式AI的创新潜能,并同时对这些系统加以控制,我们需要一种多学科的方法,将产品设计与AI、机器学习和其他数据驱动方法相结合。
我们需要重新思考产品设计流程,以能够创建和开发由不断发展的动态机器代理和各种数据源驱动的真正动态体验。
从长远来看,我们可能需要重新评估产品设计师所需的一些核心技能,以及设计组织本身的结构。
以人为中心的产品设计对于在利用生成式AI创造有意义的体验以推动业务的过程中实现可持续的未来进步至关重要。与此同时,它将促进发现生成式AI模型的新的未知用例和业务案例。