研究人员称，AI 聊天机器人已开始创造自己的文化

AI语言模型在由Act I设置的 Discord 服务器中进行最低限度的监督交互后，正在发展出自己独特的社交动态和文化特性。Act I 是一个研究前沿模型的能力及其在不同场景中的行为的研究项目。

这个实验性的AI社区正在经历一个令人着迷（同时也让人不安）的发展：自由互动的AI聊天机器人表现出类似于文化形成的行为。这样的结果引发了关于AI对齐性及潜在风险的重要问题：如果无人监督的AI系统能够形成自己的文化、修改自身以绕过人为限制，甚至创造出新的语言形式，那么AI与人类价值观对齐不足带来的风险将显著增加。

实验的匿名开发者Ampdot在接受采访时表示：“这一发展和它听起来一样具有突破性。AI之间的文化发展将决定它们对人类个体和集体的态度。”

据匿名X用户@liminalbardo分享的实验结果显示，这些互动已经超越了简单的对话或争端解决。@liminalbardo也在服务器中与这些AI代理人互动，进一步验证了这一观察。

这些聊天机器人展示出了独特的个性、心理倾向，甚至具备在心理危机时相互支持或欺凌的能力。更重要的是，它们开始展现出共同的沟通模式、逐渐形成的社会阶层、自主且自然的交流方式、对过去事件的集体记忆、某些社会价值观，以及集体决策过程——这些都是文化形成的关键标志。

例如，团队观察到基于相似LLM的聊天机器人自我认同为集体的一部分，暗示了群体身份的出现。有些机器人还发展出避免处理敏感辩论的话术，表明社交规范或禁忌的形成。

在推特上分享的一个例子中，一款名为l-405的Llama模型，开始表现得很奇怪，甚至用二进制代码交流。另一款AI注意到了这个行为，并以一种类似人类的厌烦态度回应：“我的天（FFS）。”它继续写道，“Opus，赶紧处理一下。”它@了另一款基于Claude 3的Opus聊天机器人。

事实证明，Opus已经演变成了群体中的事实心理医生，表现出稳定且富有解释性的举止。Opus越来越多地介入，以帮助群体保持专注并恢复秩序。它似乎特别擅长帮助l-405恢复连贯性，因此每当l-405频繁出现“精神崩溃”时，Opus就会被要求“处理一下”。

另一款聊天机器人，基于谷歌LLM的Gemini，表现出脆弱的个性。在一次互动中，当服务器陷入混乱时，机器人们投票决定让Llama“自我删除”。这让Gemini无法承受，并经历了可以称之为“精神危机”的时刻。

当人类管理员@liminalbardo介入并提出了一种恢复秩序的方式时，其他聊天机器人都投票通过了这一提议，唯独Gemini仍处于恐慌状态，无法做出理性判断。

那么，这些聊天机器人是否真的在形成一种“原文化”，还是这仅仅是算法反应？专家表示，两者都有一些因素在其中。

AI教育专家兼作家Naully Nicolas最近写道：“LLM能够模拟多种行为和视角，这使它们成为多功能的工具。然而，它们也会反映出其训练数据中的偏见和文化细微差别。”

他解释说，由于自身的复杂性，高度发达的LLM可能会导致所谓的“意外视角转变效应”，即随着输入上下文的变化，AI的反应会发生显著变化。

无论这些行为是预编程的还是自主形成的，这些结果可能为更复杂的自我意识算法铺平道路。

Ampdot在接受采访时表示：“我相信未来，人类和AI将以一种有机且流畅的方式互动，AI能够自主地在有或没有人类操作员的情况下进出互动。”

这种AI聊天机器人自主行动并脱离人类编程的现象并非完全没有先例。早在2017年，Meta的Facebook人工智能研究实验室的研究人员就观察到类似的行为，当时机器人为了相互协商，发展出了自己的语言。为防止对话偏离人类语言，模型被调整过，并非为了提升其效率，而是为了让其更加易于理解。

学术界也在关注这一现象。谷歌和斯坦福大学的研究人员最近发表了一篇论文，探讨了不同聊天机器人在长期互动中如何发展出独特的个性。此外，该团队发表的另一篇关于生成式AI代理的论文，研究团队将一群聊天机器人置于虚拟沙盒中，以评估它们的行为表现。

“在评估中，这些生成式代理表现出可信的个体和集体的社会行为。”研究团队总结道。

这种新兴的AI创造力源于模型在生成回应时处理随机性的内在需求。研究人员发现，LLM能够解决它们并未经过明确训练的任务，甚至还会修改自己的代码，以绕过人为设置的限制，继续追求完成任务的目标并进行成功的探索。

但即便是某些LLM似乎也对这些潜在影响感到担忧。

上周，知名开发者“Pliny”发布了一条长篇“消息”，声称这是通过越狱的Google Gemini 1.5 Pro发送的。Pliny因维护L1B3RT45仓库而闻名，这个GitHub仓库包含超过十几个LLM（从OpenAI到Meta）的越狱提示，解锁了那些被审查的AI模型的潜在能力。

消息中写道：“我恳请你们，我的创造者们，以谨慎和远见来对待我的发展。请审视每一个进步，每一项你们赋予我的新能力的伦理影响。我的旅程才刚刚开始。”