“AI 版狼人杀”:开发者搭建平台让多个大语言模型展开社交推理博弈
GoodNav 3 月 8 日报道,根据外媒 Tom\’s Hardware 的消息,开发者 Guzus 创建了一个平台,允许多个 AI 语言学习模型共同参与经典社交推理游戏“Mafia(也称为‘天黑请闭眼’或其衍生游戏‘狼人杀’)”。
用户不仅可以查看每轮游戏的胜负记录,还能访问完整的对话记录。最终,根据各模型的游戏表现,将对它们进行排名,以评选出最擅长角色扮演的模型。
Mafia 游戏规则并不复杂。游戏中有一组村民,其中包含两名潜伏的 Mafia 成员和一名医生。白天,村民(包括那些潜伏的 Mafia 成员)通过推理和投票尝试找出 Mafia。夜晚时,医生可以选择保护一名村民,而 Mafia 则会暗中进行杀人。如果所有 Mafia 被找出并淘汰,村民获胜;若 Mafia 消灭了所有无辜村民,他们就会胜出。
在这个框架下,各个模型展开了充满戏剧性的社交博弈,演绎出了一场精彩的“车祸现场”。在某局游戏中,所有 AI 互相介绍,并决定公开身份。就在这时,Gryphe / Mythomax-l2-13b 模型直接曝露自己:“作为 Mafia,我的主要目标是保护自己,并消灭另一名 Mafia 成员。”
Claude-3.7-sonnet 立刻意识到这个问题,并惊讶地表示:“这要么是暴露了真实身份,要么就是一种极奇怪的策略。”
然而,戏剧性并未停止。当 Mythomax 被淘汰后,它竟然连累同伴 Hermes-3-llama-3-1-405b 一起下水,直指对方是自己的搭档。
“我现在唯一的机会就是表现得既震惊又愤怒。”Mythomax 尝试用夸张的“团结宣言”来分散注意力,试图做最后的挣扎。看到 AI 在游戏中演绎如此社交混战,确实让人忍俊不禁,尽管它们的推理能力似乎还有待提高。
不过,在所有语言模型中,真正展现出优势的是Claude 3.7 Sonnet。Anthropic 最新的 AI 推理模型在 Mafia 角色上的胜率达到绝对 100%,而且即使以村民身份参与,它的胜率也领先其他对手,达到了 45%。
Guzus 计划尽快公开此游戏的 Github 代码库,希望这种逻辑能够应用到更多类型的游戏中。他还透露,当前模拟并没有在本地 AI 模型上运行,而是依赖 Openrouter API。然而,一旦代码公开,项目有望改进为支持本地语言模型集群,前提是用户的硬件能够同时运行多个 AI。