定义 AI 未来的 8 项设计突破

界面设计师们正开拓着一片未知的领域。

十多年来，我们首次在用户体验设计中面临一个真正的空白地带。这里没有现成的策略，也没有既定的模式可供参考。就连前沿的人工智能实验室也在通过试验摸索，他们推出新的交互方式，并观察哪些方式能引起共鸣。

正如早期的iOS和Android设计选择塑造了移动计算的一个时代，如今的突破也在定义着我们未来几年与人工智能协作的方式。

实时观察这些设计选择在整个生态系统中产生的涟漪效应，真是令人着迷。当某种设计奏效时，竞争对手们会争相采用——这并不是出于懒惰，而是因为我们都在这个新范式中共同探索什么才是合理的。

在这个充满未知与机遇的时刻，新的主导模式正在涌现。今天，重点介绍那些塑造我们对人工智能交互集体理解的设计选择。如今看来，其中一些可能显而易见，但每一个都代表着发现的关键时刻，是一次成功的试验，帮助我们更好地理解人类与人工智能如何协同工作。

通过研究这些有影响力的模式，我们可以超越简单模仿成功的阶段，去塑造人工智能界面的未来发展之路。

1. 对话范式（ChatGPT）

核心观点：人类已经懂得如何通过对话来表达复杂的思想——为何还要让他们学习其他方式？

影响：确立了对话作为人机交互的基础范式

聊天界面如今如此普遍，以至于我们几乎不再对其进行深入思考，但它正是引领我们进入当前时代的突破性进展。虽然GPT早已在OpenAI的开发者控制台中可用，但那个界面并未引起广大受众的共鸣。它看起来、用起来更像是其他任何开发工具。

将底层技术转变为对话格式的决定带来了翻天覆地的变化。有趣的是，这家公司本身可能并没有太在意这一改变。但事实证明，这是这一代产品中最重要的设计选择。自那以后，聊天界面被广泛复制，影响了几乎所有随后出现的消费级AI工具。

整个生成式AI工具浪潮都是以自然语言为核心构建的，而对话则是用语言分享想法的核心机制。虽然笨拙的聊天机器人会不断进化，但对话作为一种基础范式将持续存在。

2. 源透明性（Perplexity）

核心观点：如果用户无法看到信息来源，就无法验证AI在研究领域给出的答复

影响：为搜索和研究工具中可验证的AI输出设定了新的期望

当人们开始频繁使用ChatGPT时，一个常见的抱怨就是缺乏信息来源。虽然GPT可以根据其庞大的训练数据生成答复，但无法了解这些信息的来源，这使得它很难用于正规的研究。

Perplexity通过为其AI答复引入实时引用，改变了这一局面，使其答复可追溯且可验证。此后，这一功能被广泛复制，包括OpenAI在ChatGPT中整合网络搜索功能。它解决了一个基本的信任问题：用户不仅想要答案，还想要确信这些答案的来源。

这一突破对于解决人们将AI作为新型搜索引擎使用的担忧至关重要，但现实是AI的功能远不止于此。大型语言模型（LLMs）可以增强像Perplexity这样的问答式工具，但它们也为全新的创意工作流程打开了大门。

3. 创意整合（Claude Artifacts）

核心观点：对话不仅能生成文本，还能推动创建结构化、可重复使用的资产

影响：使对话能够产生有形输出的新创意工作流程成为可能

使用Artifacts能感觉到自己是在与AI积极共创，而不仅仅是进行对话。与ChatGPT和Claude的对话对于构思很有价值，而Perplexity对于研究也很有用，但Artifacts可以从对话开始创意工作流程，并将最好的部分转化为有形输出，以便稍后导出和重复使用。尽管在通过这种基于对话的交互循环创建资产后，要使工作流程继续下去仍然还有很长的路要走，但我们正在朝这个方向前进。

Artifacts证明了AI协作将成为新创意工作流程的核心，从而改变了预期交互模式：AI不再只是辅助工具，与Claude的对话成为了核心机制，共同生成并提炼创意输出。AI不再仅仅是人类的“助手”或“副驾驶”，而是越来越多地占据了主导地位。

4. 自然交互（语音输入）

核心观点：与打字相比，说话能够提供更丰富、更自然的表达

影响：减少了向AI提供详细背景和探索想法时的摩擦

很多人仍然忽视语音作为一种输入方法。由于一代大多能力不足的语音助手（比如Siri）的存在，我们集体不相信它能起作用。但现实是，现在的AI转录技术已经非常出色了。

语音输入至关重要，因为它允许你真正使用自然语言。我们忘记了这一点，但只要我们开始写下任何东西，我们就会开始自我编辑。大声说出来可以让你的大脑充分发挥即兴创作的潜力。这种输出为大型语言模型（LLM）提供了更丰富的背景，而这正是它所需要的。人们可能会因为意识到真实口语在文本中的混乱（比如所有的“嗯”和“啊”等语气词）而感到不自在或担心。但当前的LLM并不在意这些。它们能够看透这些，甚至过滤掉很多这样的内容。

所剩下的就是一个更加自然的创意构思流程，这个流程会被AI快速且彻底地捕捉和解释。

5. 工作流集成（Cursor IDE）

核心观点：将AI深度嵌入到人们已经熟悉的工作环境中，可以极大地提升效率

影响：将代码编辑器转变为由AI驱动的创作环境

Cursor将在使用Claude Artifacts时首次体验到的AI驱动的创作工作流程直接融入了现有的代码库中。

在新语法或不熟悉的框架功能上陷入困境时，像Cursor这样的工具帮助可以绕过许多障碍。例如，当你第一次打开一个现有的代码库时，你可能会因为不知道有哪些可用内容或在哪里找到它们而感到不知所措。有了Cursor，可以就正在发生的事情和任何不确定的代码提出详细问题，并快速得到答案。

6. 环境辅助（X平台上的Grok）

核心观点：用户在遇到不理解的内容时最需要AI的帮助

影响：使上下文相关的AI辅助与内容即时可用

Grok的实用性让人大吃一惊。X平台上流动着大量的内容，经常觉得自己没有足够的上下文来完全理解某个帖子。Grok AI按钮在内容层面的直接集成，让人只需一键就能获得实时解释所面临的网络信息的上下文。无论是网络迷因、文章标题还是其他任何内容，能够调用AI助手来帮助理解所看到的内容都是非常有用的。

随着我们在线遇到的内容越来越需要解释（这是AI生成的吗？是谁发布的？他们有什么偏见？他们试图如何影响我？），这种辅助将变得更加重要。

这仍然是一个新事物，就像X平台上的许多功能一样，其设计执行还有待改进。

7. 过程透明度（Deepseek）

核心观点：展示AI如何得出结论能够增强用户的信心和理解

影响：通过使机器推理可见且易于理解，使AI响应更具人性化

Deepseek，它最近发布的R1推理模型在互联网上引起了轰动。尽管它不是第一个推向市场的推理模型，但它做出了一个从根本上改变了许多人体验的关键设计选择：它暴露了模型的“思考”。

这引起了人们的注意，因为它展示了机器是如何得出答案的，而且机器在“思考”中使用的语言看起来非常像一个人会说或会感受到的。这种可见性有助于建立对输出的信任，因为用户可以验证思考过程是否合理。另一个附带效果是，推理过程本身可能包含有用的想法——比如，也许在推理过程中出现的一个想法很有趣，值得单独进一步探索。

这让人想起了上一代网页应用中进度条的重要性。如果交互瞬间发生，可能会让人感到突兀。但如果它缓慢发生且没有任何提示，人们就会怀疑它是否在工作或是否出故障了。进度条通过帮助用户理解机器正在工作而有助于缓解这种情况。展示AI的推理过程感觉类似——它强化了模型确实在工作的观念。展望未来，不必一开始就暴露模型的推理过程，但它至少应该清晰可访问，以便用户如果选择的话可以跟随。

8. 界面延迟（Midjourney）

核心观点：核心技术的正确性比拥有精致的界面更重要

影响：展示了先关注功能如何导致更明智的界面决策

设计讨论中有太多内容集中在视觉界面上，这使得Midjourney更加有趣。该公司在早期选择避免构建自定义用户界面（UI），而是利用Discord，这是一个既有趣又具有战略意义的选择。尽管Midjourney是为视觉创作者提供的工具，但公司的核心产品是使这些视觉效果成为可能的技术。这是其他一切的基础。如果这项技术不优秀，人们就不会关心是否有网页界面。

虽然Midjourney现在有了网页UI，但最初选择避免自定义UI使他们能够专注于模型的核心功能，而不是界面。通过在Discord上启动，公司控制了产品的需求，因为许多不是早期采用者的人根本不会去那里。此外，它还提供了功能强大的基于社区的反馈循环，使产品决策能够高度明智。

因此，根据正在创建的AI类型，Midjourney提醒我们，选择不构建自定义UI本身可以是一个战略性的设计选择。

最终思考

这八大突破不仅仅是巧妙的用户界面（UI）决策，它们是人类与机器如何协同工作的新故事。每一个突破都代表了一个有人敢于尝试、敢于实验未经验证的方法，并找到了产生共鸣的模式的时刻。

从ChatGPT让AI变得对话化，到Claude将对话转化为创作，再到Deepseek向我们展示机器如何思考——我们正在见证一种新创意媒介的迅速演变。甚至Midjourney选择避免构建自定义UI也提醒我们，我们之前所认为的软件设计知识都有待重新诠释。

创新的步伐并没有放缓。相反，它在加速。但正是这一点让这一刻如此令人兴奋：我们不仅仅是观察者，更是参与者。今天，每一位与AI合作的设计师、开发人员和创作者都有机会为这种新兴的人类-AI交互语言做出贡献。