Loading...

Manus 初解析:首款“通用 AI 智能体”,开源复刻“0 天起手”

在昨天(3月6日),AI领域充满了热闹的气氛。

基础模型领域中,我们的 QwQ-32B 成为了“四两拨千斤”的典范,其性能几乎与 DeepSeek-R1 不相上下。

而在更高层次的应用领域,Manus 的问世引起了广泛关注。

官网界面

接下来,GoodNav 编辑将结合当前网络信息,为大家提供一系列汇总。

一、Manus 是什么?

Manus 是由国内团队研发的一款 AI Agent,其名称源于拉丁语中“Mens et Manus”,即心与手中的“手”。

这里我们需要提到“AI Agent”的概念,目前尚无统一的中文翻译,常用的说法是智能体。

朋友们可以理解为一个能够自主感知环境、分析信息、制定决策并执行任务的智能助手。

在通用 AI 助手能力的 GAIA 测试中,Manus 取得了 SOTA(State-Of-The-Art)即当前最好的成绩。

GAIA 测试成绩

创始人季逸超表示,Manus 当前是由多个模型驱动,官方将在今年晚些时候开源部分模型的后续训练成果。

二、Manus 的功能有哪些?

官方表示,Manus 不同于我们熟知的 ChatGPT 等聊天机器人,而是“首款通用的 AI 智能体”。

▲ 是骡子是马,拉出来溜溜

当然,这种说法可能略显夸张,我们先来看看官方实际演示的案例。

演示 1:简历筛选

将包含简历的 zip 文件上传到 Manus 中,系统会像“人”一样解压文件并查阅简历内容,记录下关键信息。

在 Manus 执行任务时,你也可以随时补充更多信息。

简历筛选任务完成后,Manus 会提供候选人的评估、个人信息的总结及相关报告资料。

接着,你还可以指示 Manus 生成评估结果表格,让它在未来同类任务中能够自动生成表格,如同一名真正的助手。

这一例子并未超出我们对于现有大型模型能力的预期,但现存的聊天机器人产品确实无法轻易一键完成所有任务。

演示 2:调查房产

官方的第二个演示是让 Manus 筛选符合特定条件的纽约房产。

面对这一复杂任务,Manus 首先会将其分解,生成一个待办事项清单。

然后,Manus 开始在网络上搜索信息并进行筛选。

完成“网上冲浪”后,Manus 将自动编写 Python 程序来评估预算情况。

根据预算,Manus 自动调整房产网站的筛选条件,选取合适的范围。

最终,Manus 会综合上述所有信息,生成一份详细的报告。

演示 3:股票分析

官方提供的第三个演示是分析三只股票过去三年的表现。

Manus 可以使用授权的专业信息,通过编写代码来分析所获取的数据。

朋友们可能注意到,Manus 可以说是“一有难处就编程”。

对 Manus 而言,编程并非“目的”,而是实现某目标的一个通用工具。

如果觉得这样的可视化图表不够“酷”,还可以让 Manus 根据这些数据创建一个交互式网站。

生成网站演示

实际上,这次官方介绍视频的脚本也是由 Manus 创建的。

三、在全网走红后的续集

我们可能注意到,Manus 执行一项任务时,根据其复杂程度,通常需要几分钟、十几分钟甚至数十分钟的时间。

每项任务都要求在服务器上开启一个独立的 Ubuntu 容器,这在过程中会消耗不少的服务器资源。

可能这也是其目前仅通过邀请制的原因之一。

邀请码

在昨天(3月6日),Manus 的邀请码在闲鱼上一度被哄抬至几万元,甚至出现了乱标价格的现象。

提醒大家注意防止诈骗,官方从未设置付费获得邀请码的渠道。

▲ Manus 合伙人张涛对此的回应

类似产品中,我能够想到荣耀的 YOYO 智能体,它可以在用户的手机端自动执行任务。

▲ 一句话点 2000 杯咖啡

除此之外,还有智谱的 AutoGLM,尽管它在各品牌的安卓设备上都有使用,但当前能力相对有限。

AutoGLM

从某种角度看,它们都是基于现有大模型能力所重新包装的“外壳”。

若需要一份调查报告,则当前 ChatGPT 的 Deep Research 深入研究功能效果也很出色。

Deep Research 深入研究

▲ ChatGPT Plus 会员每月可用 10 次

马斯克的 Grok 3 免费的 DeepSearch 功能,其实也能够协助我们完成不少任务。

Grok 3 免费的 DeepSearch 功能

四、开源复刻,0 天起手

在赞同和批评中,小编发现有位朋友的评价比较中肯。

中肯

对很多 AI Agent 团队而言,Manus 的成就或许并不是颠覆性的,因此在 Manus 上线的当天,就出现了一些开源的“复刻”项目。

OpenManus 项目

有了 Manus,我就有了 OpenManus,来自 MetaGPT 团队的5 名成员在 3 个小时内便“搞定”了一个开源解决方案。

同时,CAMEL-AI 团队也基于其 CAMEL-AI Framework 开发了 OWL 项目,在 GAIA 测试中取得了平均 58.18 分的优异成绩,位列开源框架的首位。

OWL 项目

▲ 请帮我找到今天伦敦有什么电影?

无论大家怎么看待,相信我们已经对 Manus 和 AI Agent 有了基本的认识。

距离 AI 助手自动化处理繁重任务的那一天或许真的不远了。

© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...