Manus 是一款“代理”人工智能平台,于上周预览推出,其引发的关注度甚至超过了泰勒·斯威夫特的演唱会。
Hugging Face 的产品负责人称 Manus 是“我尝试过的最令人印象深刻的人工智能工具”。人工智能政策研究员 Dean Ball将Manus 描述为“使用人工智能的最复杂的计算机”。Manus的官方 Discord 服务器在短短几天内就增长到超过 138,000 名成员,据报道,Manus 的邀请码在中国经销商应用闲鱼上以数千美元的价格出售。
但尚不清楚这种炒作是否合理。
优秀https://t.co/TfeV9QZ1d0
— jack (@jack) 2025 年 3 月 9 日
Manus 并非完全从零开始开发。据社交媒体报道,该平台结合使用现有和经过微调的 AI 模型,包括 Anthropic 的 Claude 和阿里巴巴的 Qwen,来执行起草研究报告和分析财务文件等任务。
然而,在其网站上,蝴蝶效应——Manus 背后的中国公司——给出了该平台据称可以实现的一些疯狂例子,从购买房地产到编程视频游戏。
在 X 上的一段热门视频中,Manus 的研究负责人 Yichao “Peak” Ji 暗示该平台优于 OpenAI 的深度研究和Operator等代理工具。Ji 声称,Manus 在通用人工智能助手的流行基准 GAIA 上的表现优于深度研究,GAIA 可探测人工智能通过浏览网页、使用软件等方式开展工作的能力。
“[Manus] 不仅仅是一个聊天机器人或工作流程,”Ji 在视频中说道。“它是一个完全自主的代理,可以弥补概念和执行之间的差距 [...] 我们将其视为人机协作的下一个典范。”
但一些早期用户表示,Manus 并不是万能的。
人工智能初创公司 Pleias 的联合创始人亚历山大·多里亚 (Alexander Doria)在 X 上的一篇帖子中表示,他在测试 Manus 时遇到了错误消息和无限循环。其他 X 用户指出,Manus 在事实问题上犯了错误,并且没有始终如一地引用其工作——并且经常错过在网上很容易找到的信息。
深度研究在 15 分钟内完成。不幸的是,Manus AI 在 50 分钟后在第 18/20 步失败了!😑它表现得相当不错 - 我观察了 Manus 的输出,它看起来很棒。然而,第二次运行相同的提示有点令人沮丧,因为它花费的时间太长了!https://t.co/bGtmOI65CP
— Derya Unutmaz,医学博士 (@DeryaTR_) 2025 年 3 月 8 日
我与 Manus 的合作经历并不是十分愉快。
我要求该平台处理一个在我看来相当简单的请求:从我送货范围内的顶级快餐店订购一份炸鸡三明治。大约十分钟后,Manus 崩溃了。第二次尝试时,它找到了符合我条件的菜单项,但 Manus 无法完成订购流程——甚至无法提供结账链接。
当我要求 Manus 预订从纽约飞往日本的航班时,它同样失败了。鉴于我认为没有留下太多歧义的指令(例如“寻找商务舱航班,优先考虑价格和灵活日期”),Manus 所能做的最好的事情就是提供多家航空公司网站和 Kayak 等机票搜索引擎的票价链接,其中一些网站已经崩溃。
希望接下来的几个任务能成功,我告诉马努斯在步行距离内的一家餐厅预订一张桌子。几分钟后失败了。然后我要求平台构建一款火影忍者风格的格斗游戏。半小时后它出错了,这时我决定放弃。
在过去 3 天尝试 Manus AI 之后的诚实看法,以下是其优点和缺点。
优点:
– 它在互联网上进行的研究和生成的报告令人难以置信。
– 它在后台运行脚本来执行任务的能力令人印象深刻。
– 它的计划……
— AshutoshShrivastava (@ai_for_success) 2025 年 3 月 9 日
Manus 的发言人通过 DM 向 TechCrunch 发送了以下声明:
“作为一个小团队,我们的重点是不断改进 Manus,并制造出真正帮助用户解决问题的 AI 代理 [...] 当前封闭测试的主要目标是对系统的各个部分进行压力测试并找出问题。我们非常感谢大家分享的宝贵见解。”
那么,如果 Manusis 未能兑现其技术承诺,它为何会失败呢?有几个因素导致了失败,比如邀请人数稀少导致的排他性。
中国媒体迅速将 Manus 吹捧为人工智能的突破;《QQ 新闻》称其为“国货之骄傲”。与此同时,社交媒体上的人工智能影响者散布了有关 Manus 能力的错误信息。一段广为流传的视频显示,一个桌面程序(表面上是 Manus)在多个智能手机应用程序中采取行动。纪证实,该视频实际上并不是 Manus 的演示。
X 上其他有影响力的 AI 账户试图将 Manus 与中国 AI 公司DeepSeek进行比较——这种比较不一定基于事实。与 DeepSeek 不同,蝴蝶效应没有开发任何内部模型。尽管 DeepSeek 公开了许多技术,但 Monica 还没有——至少目前还没有。
公平地说,《蝴蝶效应》的 Manus 还处于早期阶段。该公司声称正在努力扩大计算能力并修复报告的问题。但就目前平台而言,Manus 似乎是技术创新之前的炒作。