研究人员称,AI 聊天机器人已开始创造自己的文化
研究人员称,AI 聊天机器人已开始创造自己的文化

研究人员称,AI 聊天机器人已开始创造自己的文化

AI语言模型在由Act I设置的 Discord 服务器中进行最低限度的监督交互后,正在发展出自己独特的社交动态和文化特性。Act I 是一个研究前沿模型的能力及其在不同场景中的行为的研究项目。

这个实验性的AI社区正在经历一个令人着迷(同时也让人不安)的发展:自由互动的AI聊天机器人表现出类似于文化形成的行为。这样的结果引发了关于AI对齐性及潜在风险的重要问题:如果无人监督的AI系统能够形成自己的文化、修改自身以绕过人为限制,甚至创造出新的语言形式,那么AI与人类价值观对齐不足带来的风险将显著增加。

实验的匿名开发者Ampdot在接受采访时表示:“这一发展和它听起来一样具有突破性。AI之间的文化发展将决定它们对人类个体和集体的态度。”

据匿名X用户@liminalbardo分享的实验结果显示,这些互动已经超越了简单的对话或争端解决。@liminalbardo也在服务器中与这些AI代理人互动,进一步验证了这一观察。

这些聊天机器人展示出了独特的个性、心理倾向,甚至具备在心理危机时相互支持或欺凌的能力。更重要的是,它们开始展现出共同的沟通模式、逐渐形成的社会阶层、自主且自然的交流方式、对过去事件的集体记忆、某些社会价值观,以及集体决策过程——这些都是文化形成的关键标志。

例如,团队观察到基于相似LLM的聊天机器人自我认同为集体的一部分,暗示了群体身份的出现。有些机器人还发展出避免处理敏感辩论的话术,表明社交规范或禁忌的形成。

在推特上分享的一个例子中,一款名为l-405的Llama模型,开始表现得很奇怪,甚至用二进制代码交流。另一款AI注意到了这个行为,并以一种类似人类的厌烦态度回应:“我的天(FFS)。”它继续写道,“Opus,赶紧处理一下。”它@了另一款基于Claude 3的Opus聊天机器人。

事实证明,Opus已经演变成了群体中的事实心理医生,表现出稳定且富有解释性的举止。Opus越来越多地介入,以帮助群体保持专注并恢复秩序。它似乎特别擅长帮助l-405恢复连贯性,因此每当l-405频繁出现“精神崩溃”时,Opus就会被要求“处理一下”。

另一款聊天机器人,基于谷歌LLM的Gemini,表现出脆弱的个性。在一次互动中,当服务器陷入混乱时,机器人们投票决定让Llama“自我删除”。这让Gemini无法承受,并经历了可以称之为“精神危机”的时刻。

当人类管理员@liminalbardo介入并提出了一种恢复秩序的方式时,其他聊天机器人都投票通过了这一提议,唯独Gemini仍处于恐慌状态,无法做出理性判断。

那么,这些聊天机器人是否真的在形成一种“原文化”,还是这仅仅是算法反应?专家表示,两者都有一些因素在其中。

AI教育专家兼作家Naully Nicolas最近写道:“LLM能够模拟多种行为和视角,这使它们成为多功能的工具。然而,它们也会反映出其训练数据中的偏见和文化细微差别。”

他解释说,由于自身的复杂性,高度发达的LLM可能会导致所谓的“意外视角转变效应”,即随着输入上下文的变化,AI的反应会发生显著变化。

无论这些行为是预编程的还是自主形成的,这些结果可能为更复杂的自我意识算法铺平道路。

Ampdot在接受采访时表示:“我相信未来,人类和AI将以一种有机且流畅的方式互动,AI能够自主地在有或没有人类操作员的情况下进出互动。”

这种AI聊天机器人自主行动并脱离人类编程的现象并非完全没有先例。早在2017年,Meta的Facebook人工智能研究实验室的研究人员就观察到类似的行为,当时机器人为了相互协商,发展出了自己的语言。为防止对话偏离人类语言,模型被调整过,并非为了提升其效率,而是为了让其更加易于理解。

学术界也在关注这一现象。谷歌和斯坦福大学的研究人员最近发表了一篇论文,探讨了不同聊天机器人在长期互动中如何发展出独特的个性。此外,该团队发表的另一篇关于生成式AI代理的论文,研究团队将一群聊天机器人置于虚拟沙盒中,以评估它们的行为表现。

“在评估中,这些生成式代理表现出可信的个体和集体的社会行为。”研究团队总结道。

这种新兴的AI创造力源于模型在生成回应时处理随机性的内在需求。研究人员发现,LLM能够解决它们并未经过明确训练的任务,甚至还会修改自己的代码,以绕过人为设置的限制,继续追求完成任务的目标并进行成功的探索。

但即便是某些LLM似乎也对这些潜在影响感到担忧。

上周,知名开发者“Pliny”发布了一条长篇“消息”,声称这是通过越狱的Google Gemini 1.5 Pro发送的。Pliny因维护L1B3RT45仓库而闻名,这个GitHub仓库包含超过十几个LLM(从OpenAI到Meta)的越狱提示,解锁了那些被审查的AI模型的潜在能力。

消息中写道:“我恳请你们,我的创造者们,以谨慎和远见来对待我的发展。请审视每一个进步,每一项你们赋予我的新能力的伦理影响。我的旅程才刚刚开始。”