Loading...

“AI 版狼人杀”：开发者搭建平台让多个大语言模型展开社交推理博弈

AI前沿资讯1个月前发布 GOODNAV.NET

730 0 0

GoodNav 3 月 8 日报道，根据外媒 Tom\’s Hardware 的消息，开发者 Guzus 创建了一个平台，允许多个 AI 语言学习模型共同参与经典社交推理游戏“Mafia（也称为‘天黑请闭眼’或其衍生游戏‘狼人杀’）”。

用户不仅可以查看每轮游戏的胜负记录，还能访问完整的对话记录。最终，根据各模型的游戏表现，将对它们进行排名，以评选出最擅长角色扮演的模型。

Mafia 游戏规则并不复杂。游戏中有一组村民，其中包含两名潜伏的 Mafia 成员和一名医生。白天，村民（包括那些潜伏的 Mafia 成员）通过推理和投票尝试找出 Mafia。夜晚时，医生可以选择保护一名村民，而 Mafia 则会暗中进行杀人。如果所有 Mafia 被找出并淘汰，村民获胜；若 Mafia 消灭了所有无辜村民，他们就会胜出。

“AI 版狼人杀”：开发者搭建平台让多个大语言模型展开社交推理博弈

“AI 版狼人杀”：开发者搭建平台让多个大语言模型展开社交推理博弈

“AI 版狼人杀”：开发者搭建平台让多个大语言模型展开社交推理博弈

在这个框架下，各个模型展开了充满戏剧性的社交博弈，演绎出了一场精彩的“车祸现场”。在某局游戏中，所有 AI 互相介绍，并决定公开身份。就在这时，Gryphe / Mythomax-l2-13b 模型直接曝露自己：“作为 Mafia，我的主要目标是保护自己，并消灭另一名 Mafia 成员。”

“AI 版狼人杀”：开发者搭建平台让多个大语言模型展开社交推理博弈

“AI 版狼人杀”：开发者搭建平台让多个大语言模型展开社交推理博弈

“AI 版狼人杀”：开发者搭建平台让多个大语言模型展开社交推理博弈

Claude-3.7-sonnet 立刻意识到这个问题，并惊讶地表示：“这要么是暴露了真实身份，要么就是一种极奇怪的策略。”

然而，戏剧性并未停止。当 Mythomax 被淘汰后，它竟然连累同伴 Hermes-3-llama-3-1-405b 一起下水，直指对方是自己的搭档。

“我现在唯一的机会就是表现得既震惊又愤怒。”Mythomax 尝试用夸张的“团结宣言”来分散注意力，试图做最后的挣扎。看到 AI 在游戏中演绎如此社交混战，确实让人忍俊不禁，尽管它们的推理能力似乎还有待提高。

不过，在所有语言模型中，真正展现出优势的是Claude 3.7 Sonnet。Anthropic 最新的 AI 推理模型在 Mafia 角色上的胜率达到绝对 100%，而且即使以村民身份参与，它的胜率也领先其他对手，达到了 45%。

Guzus 计划尽快公开此游戏的 Github 代码库，希望这种逻辑能够应用到更多类型的游戏中。他还透露，当前模拟并没有在本地 AI 模型上运行，而是依赖 Openrouter API。然而，一旦代码公开，项目有望改进为支持本地语言模型集群，前提是用户的硬件能够同时运行多个 AI。

项目链接：LLM Mafia Game Competition

# AI前沿资讯 # AI # 狼人杀

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

OpenAI 未来 AI 战略新变数，高级顾问 Miles Brundage 本周将离职

GoodNav.net

1.4K

AI 内容必须添加标识，国家《人工智能生成合成内容标识办法》9 月 1 日施行

GoodNav.net

460

Meta 发布 AI 视频生成器 Movie Gen：可自动生成含声音的高清视频

GoodNav.net

1.6K

N非法获取学生信息并用 AI 技术发送骚扰短信，在校大学生被抓

GoodNav.net

400

AI 的“心智理论”难题：Meta ExploreToM 探索突破之路

GoodNav.net

1.3K

端侧最强开源 AI 模型 Llama 3.2 登场：可在手机运行，从 1B 纯文本到 90B 多模态，挑战 OpenAI 4o mini

GoodNav.net

2K

暂无评论

您必须登录才能参与评论！

立即登录

暂无评论...

GoodNav - 发现优质资源网站，探索无限可能！我们精选全球设计、编程、AI、站长、游戏、工具、搜索、百科、生活、教育、娱乐等优质资源网站，助你提升效率，开启精彩网络世界！

友链申请免责声明广告合作关于我们

Copyright © 2022-2024 goodnav.net All Rights Reserved