5 个人三小时复刻开源版 Manus,邀请码也不需要
这道门槛…… 一夜成名的 Manus,如今已推出开源的复刻版本!
5 位开发者用 3 小时,打造出一款完全免费的OpenManus,无需排队即可使用。
要评估复刻的效果,可以直接查看 Manus 官方与开源团队提供的 demo 对比。
作为全球首个通用智能体,官方演示案例如下:
而 OpenManus 团队在三小时内复刻出的成果如下:
效果请大家自行体验。
对于动手能力强的小伙伴,也期待你们体验后留言反馈。
从开源反推 Manus 的实现路径
与此同时,通过深入研究 OpenManus,我们也能够清晰地发现实现 Manus 的合理路径。
(当前 Manus 使用的具体模型、Agent 框架等细节尚未公开)
概括而言,OpenManus 背后有三大关键因素:
-
具备模块化的 Agent 系统;
-
拥有实时反馈机制;
-
配备完整且强大的工具链;
其核心设计正是这样的模块化 Agent 系统。开发者能够按需自由组合不同功能模块,以创建独特的 AI 助手。
在 OpenManus 中,不同职能的 Agent 协同完成需求理解、规划、行动等任务。
例如,Manus 的主代理就像项目经理,负责理解用户需求并进行分工;PlanningAgent 作为规划员,将复杂任务进一步拆分为可执行步骤;而 ToolCallAgent 则担当技术专家,负责管理各种工具的使用。
这一切都是基于开源团队之前提出的 MetaGPT(一个多智能体框架)实现,开发者可以自由集成多种合适的大语言模型。
此外,OpenManus 的另一关键在于其思维过程的公开透明。
正如起初提到的例子,任务一旦接手,OpenManus 的思考方式及执行规划…… 都能实时反馈。
这为人类在合适的时机进行干预提供了“窗口”,有助于更高效地完成任务。
最后不得不提及 Agent 如何使用工具。
为完成复杂任务,OpenManus 还配备了一系列“外援”:
-
浏览器自动化:模拟人类操作浏览器,自动分析网络信息并进行交互;
-
各类代码执行器:能实时生成和执行代码;
-
文件处理:自动生成及管理各种文档;
-
……
需要强调的是,这些工具并非独立模块,必须协同设计。
将这些元素结合起来,构建这种多智能体系统的一般架构为:底层由多种大语言模型组成,中间层通过多智能体协作拆解任务,执行层调用各种 API 完成具体操作。
总而言之,OpenManus 的作者总结认为,这一开源成果结合了 computer-use、基础的 Agents 以及规划能力。
正如 OpenManus 团队在致谢中提到的,Claude 厂商 Anthropic 去年发布的computer-use和 YC 投资的browser-use,都为 OpenManus 打下了基础。
顾名思义,这两个项目分别用于操作计算机和浏览器,而在沙盒环境中操控正是 Manus 工作的核心特征之一。
5 人开发团队,3 小时完成复刻
OpenManus 团队在1 小时内就搭建完成了核心系统,整体只花了 3 小时。
核心作者梁新兵表示,OpenManus 的迅速推出源于 MetaGPT 积累的技术基础。
(注:MetaGPT 是一个多智能体框架,旨在通过将不同角色分配给 GPT 模型来处理复杂任务,形成一个协同工作的“软件公司”。)
我们只是将浏览器工具链与之前的代码进行融合,结合已有的 Agent 工具包。
几位研发成员均来自 MetaGPT 团队。
“开源版 Devin”—— 数据解释器(Data Interpreter),同样由 MetaGPT 团队制作。
OpenManus 的核心作者梁新兵,毕业于华东师范大学,在就读期间参与了 Data Interpreter 项目的开发。
另一位核心作者向劲宇,本科就读于西南交通大学应用物理系。
去年大四时,他与队友利用 GPT-4 和 Claude 3 组成多智能体方案,让 AI 扮演多个角色,进行相互验证以完成答题步骤,取得了阿里巴巴数学竞赛 AI 赛道全球第二名。
在 MetaGPT 社区,向劲宇还与其他成员合作,使得智能体成功在“我的世界”中获得钻石。
他曾让智能体模拟知乎大 V 回答 100 多个问题,获得超过 3 万次浏览、赞同、反驳和私信关注,直到他主动停止,AI 的真实身份都未被识破。
张佳钇,于去年本科毕业于中国人民大学高瓴人工智能学院,目前在港科大(广州)攻读博士学位,参与了即将在 ICLR 2025 上发布的智能体框架 AFlow,且与向劲宇为共同一作。
于兆洋是张佳钇的同级同学;洪思睿为 MetaGPT 和 Data Interpreter 两篇论文的共同一作,现为 DeepWisdom 高级研究员,香港科技大学硕士,本科毕业于暨南大学。
在 AFlow 的作者名单中,也可见于兆洋和洪思睿的名字。
今年,张佳钇和向劲宇作为共同一作,五位作者的名字共同出现在一个名为 SPO 的项目中,该项目旨在让提示词自我演化,解放人们于繁琐的提示词工程。
综合五位作者的经历与署名信息可见,除了 15 年取得硕士学位的洪思睿略显年长外,其余四位作者几乎都是刚本科毕业,部分选择继续深造,另一些则加入了 DeepWisdom。
重新审视 Manus 的“套壳风波”
此外,OpenManus 的出现或许为 Manus 的“套壳风波”提供了新的视角。
先来简单回顾一下这场争议。
Manus 被质疑“套壳”的主要原因有两个:
第一是已有的先例。Manus 背后团队曾开发出另一款产品——Monica,而作为一款集成多种语言模型的插件,Monica 也曾陷入套壳争议。
因此,人们对该公司出品的产品自然会产生联想。
在此背景下,由于产品被认为是套壳拼凑而成,大家容易形成 Manus 技术含量不高的印象。
然而,之所以认为 OpenManus 提供了新视角,是因为其复现路径表明,许多模块基于现有的开源项目构建。
有效统筹和调度各个模块来形成新功能,绝非任何人都能做到。
而开源社区的重要意义正是为后来的开发者提供站在巨人肩膀的机会。
不提开源,各大模型厂商提供 API 给开发者的目的也是为了让他们能开发新应用。
将此夸大一点,引用 Perplexity 创始人的话,“OpenAI 就是英伟达的套壳,英伟达算是台积电的套壳,台积电又是沙子的套壳……”。
所以,是否“套壳”并非核心问题,关键在于能否产生实质的生产力提升。
不过,从我们昨天的实测中发现,Manus 离这一目标还有相当的距离。
因此,提升产品的能力或许比过于纠结于套壳更为重要。
您对 Manus 的看法如何?欢迎在评论区留言讨论。
开源地址:
https://github.com/mannaandpoem/OpenManus
参考链接:
-
[1]https://x.com/didiforx/status/1897675038972883408
-
[2]https://www.sohu.com/a/827134153_121798711
-
[3]https://modelscope.cn/studios/AI-ModelScope/SPO
本文来源于微信公众号:量子位(ID:QbitAI),作者:克雷西、一水,原标题《5 人三小时复刻开源版 Manus,邀请码也不需要了》