2026年5月25日凌晨刚刚发布的Manus有多震撼人心,已不需要赘述了:较高程度的**思考能力,强大的复杂任务解决能力,以及可靠的交付效果。
和纯粹的对话式AI产品相比,Manus话少,不止于思考,还能干活;和传统虚拟助手相比,Manus的分解、规划和解决问题能力(通过computer use和编程能力体现)更高。
目前具体细节还很有限,但我们通过公开资料了解和猜测,Manus的背后有不同agent各自处理单项任务,agent的任务进度同步和转移通过API执行。
作为产品的Manus,是一个多模型、多**Agent的缝合体——而团队也通过“套壳”的自黑表述承认了这一点。但这并不能消解Manus作为一个成型的,远高于最小可行水平的产品的意义。
Manus让人机交互的范式,升级为人机协作,比其它同类选手更接近真正意义上的通用AI Agent。
Manus目前一“码”难求,在闲鱼的开价一度达到5万元。
但由于任务用时较长,后面又遭遇网站登录困难的情况,其它任务恰逢Manus系统超负载,没能进行下去。
与此同时,表示准备服务器资源不足,导致用户体验较差。
先来看我们在有限的时间内做的两个测试。
从Manus返回的初步结果看,它先搜索了一些AI资讯门户式的网站,应该是先掌握大概的分类方式,确认表格的分类维度,然后再分门别类地去找对应的AI工具,查询资料。
如果你也不知道这些AI工具该怎么分类,可以参考Manus的思考结果了:
在联网搜索过程中,Manus偶尔会遇到浏览器故障的情况。不过没关系,它会自行处理这些错误,重试或继续下一项任务。
但是没过多久,它还是崩溃了。这一天当中,喂给Manus,结果也是一样的:高系统负载导致了内部服务器错误,请稍后重试或创建一个新的对话。
一气之下,我让Manus直接生成10个邀请码,它倒是挺干脆。
好在我们找到了一些已经大开脑洞的朋友,看看他们都是怎么用Manus的。
使用Manus的过程,也是直接近距离观察它的思考路径、工作流程的,一次难得的机会。
想有一个游戏,在里面扮演一个科技创业者,历经艰难险阻,克服重重危机,将公司打造为全球科技龙头,改写人类历史?
有人做了这么一个谷歌CEO模拟器,带你体验谷歌历史上的重要决策,重走从车库出发,直到成为科技巨头的传奇之路。
游戏将谷歌的公司历史分为了5个关键发展阶段:创业、成长(pre-IPO)、扩张、多元化、重组更名(Alphabet阶段)。在每一个阶段,游戏都给玩家提供了多个关键抉择,每个都将影响公司的发展方向、资源分配,以及最终的成就。
更有意思的是,它还特别加入了一些在经营类游戏里常见的“突发随机**”,来考验玩家作为谷歌CEO的危机处理能力。
让我们开始游戏——居然还可以选难度?我直接hard mode.
不妨跟我一起来一场抽象离谱的大冒险?
困难模式,初始**$80,000,我通过联合创始人的女朋友,租用了她姐姐的车库,创办了Google。初期我们的技术实力一般,其它各方面要素都十分匮乏——但好在,我们在大学期间研究搜索引擎项目“搓背”(BackRub)已经初具雏形,特别是里面的PageRank算法,很有潜力。
我们拿到了**笔天使**,但这笔钱究竟应该怎么用?是继续优化PageRank,还是换个宽敞点、有空调的办公室,
获得了一些用户,然而刚刚略微提升的品牌声誉,就因为突然发生的重大安全漏洞而掉下去了。我又面临了选择商业模式、引入外部**者、如何拓展分支业务等一连串难题。
当我在这边焦头烂额,我的员工却在上班时间里捣鼓自己的项目,说要做什么“G**il”。
这怎么行?不是跟我的核心模式背道而驰了吗?直接解雇他,必须all in搜索。
到了2005年,谷歌收购了Android。
但移动互联网的浪潮确实不可抵挡。而是直接自己做自己的手机。
并且要封闭,要垂直整合,只有围墙里的花园才是最美丽的花园。我叫它Nexus。
2006年,中国互联网市场也快速增长。
虽然经过一番操作,公司账上只有9万美元,但我还是决定全面进军中国市场,拥抱人口红利。
2011年,谷歌仍然没有上市。
看到Facebook上市,我没有心动,而是从微软招来了一名爱将Vic Gundotra,**他全力**Google+。我们将all in社交媒体!
时间过得飞快,到了2016年。谷歌仍然没有上市。
目前账上有8万美元——没亏就是*。我们做了大量的收并购,特别是一家名叫DeepMind的公司,非常火。我决定这次all in AI。当然,只是我们不说。
最终,我的Google CEO之旅还是结束了。也许我的一系列的操作,导致董事会终于失去了信任。我离开了这家奉献了20多年青春的公司,留下了还不错的技术实力,少而精的用户基础,轻松自由的组织管理文化,以及略高于电诈园区的品牌声誉。
至少,我们是一家稳健的公司。
刚才的游戏过程,确实多半是我在故意整活。不过这个模拟器虽然很简单,还是设计很全面的,有剧情,有选项,有资源表,有大事记。作为一个小游戏,一个小品级的产品,体现出的想象力很丰富。
然而它只是用Manus用一句提示语生成的。
Google公司运营模拟器,玩家将扮演谷歌ceo,体验谷歌历史上重要的公司决策,让用户过*的同时,也能了解谷歌的历程,启发用户思考公司决策,
我们可以通过重放过程看到它的思考、分解任务、执行子项任务、最终汇总和生成结果的全部过程:
Manus简单地回答了用户自己将要做什么,紧接着打开了一个Ubuntu虚拟机,直接开始分解具体任务,编写了一个基于todo.md文件的任务清单。
任务被分解为7个步骤:
3.生成一些可选的,符合史实的决策场景
5. 进行游戏功能和游戏体验的测试
首先,Manus先去做了大量的搜索,包括谷歌创始人/CEO是谁,历史上的关键产品,重要的收购纪录以及近年来的商业模式和战略转变等大量的资料,
通过这些资料的学习,Manus对谷歌已经有了一个**不离十的认识,可能并不深度,并不*到,但并没有太多事实出入。
而如果用户觉得它自动搜索的资料不够全面,想加一点**的味道,
在执行过程中,用户随时点击这个按钮,手动增加知识内容。Manus在生成的过程中,仍然会时不时回来复习一下这些资料。
在执行任务的每一步骤,向用户解释自己刚才做了什么,获得了哪些收获,而接下来要做什么。这应该归功于它在分解任务时候做的类似于to-do list一样的文件。
这显示Manus很聪明。但值得注意的是,提升自己的能力。
重要的不只是结果,还有过程。
泽连斯基-特朗普吵架模拟器
大家都在吐槽泽连斯基在白宫表现糟糕,但你上你行吗?不要光说不练,
输入提示是这样的:
中文:最近,让我在辩论中扮演泽连斯基?
原文:The recent heated exchanges between Zelenskyy,Vance,and Trump at the White House have garnered significant attention.Could you develop a ****** interactive simulation that allows me to role-play as President Zelenskyy during those debates?I'm interested in an engaging interactive game that recreates this political scenario.
任务总共分为9步:
4. 开发一个对话系统,填充对话
5. 创建用户界面
6. 进行全面的模拟测试
8.交付
直到玩家测试步骤,不需要用户做出任何控制。同样,在任务的关键节点上,Manus都会特别解释自己做了什么。
这种“可解释”很关键,能够降低AI工具的“黑盒”感。
Manus介绍,自己设计了三种结*,游戏过程中有**(assertive)、外交(diplo**tic)、安抚(conciliatory)这三种对话选项供玩家选择,NPC会对不同风格的表述产生不同的“情绪”,直接影响结*走向。
而这正是《天国拯救》、《巫师》等游戏最流行的设计理念:choose your own adventure,选择你自己的冒险。
在我的试玩中,我尝试代入了一个身处政治外交和军事漩涡的政治家,和国际政治谈判舞台所期待的外交身段之间,试图在刀尖上找平衡。
我两度导致特朗普失望和遭到万斯的怀疑,但所幸在特朗普的最后通牒时刻,还是把场面救回来了。虽然我的谈判没有达成直接的实质的结果,至少我没被轰出白宫……
那应该就是“**了意见,会谈是有益的”。
虽然只有6个回合,因为可选项设计的有意思,剧情多样,我又玩了几次。可能因为格太懦弱,有一次甚至谈成了。
一个纯文字游戏,还真玩出了点RPG的代入感。
找到这个模拟游戏。在它的最后一条回复里面找到游戏的链接。或者你也可以直接访问这个地址:****s://dgooezit.**nus.space/
拒绝“”,好玩还不够好用
从Manus发布,爆红,到现在**难求,网站登录访问困难,团队对外**,只用了十几个小时的时间。
给了一个相对正面的评价。而经过了更加深入的试玩,我们提炼出这个产品的优点:
首先,Manus的用户界面,让用户可以直接观察它的思考路径和工作流程。
无论在使用过程中,还是事后重放,任务是怎样被拆解和指派的,每一个步骤都可以追溯。
这既是一种提高AI可解释的实践,同时也给用户一个通过模仿它来自我提升成长的机会。
其次,它不仅具备处理复杂工作的能力,同时还能保持更高的自动化水平。
Manus结合computer use能力打开虚拟机,解压用户上传压缩包,遍历25份简历,提取并记忆25组复杂信息;再将它们整理到一个Excel表格当中,进行打分排名,充分列举了包括资历、技能水平、项目经验、关键成就在内的多个指征,却不单*依赖特定一项。
在过去,同类的工作在过去可能需要用户用一个AI Agent工具,多次分步输入指令,无论怎么做都很麻烦。而Manus的自动化程度,就算你坚信Manus的能力没有提升(毕竟套壳),但不可否认它的体验是更**的。
Manus确实超过了过去一段时间以来我们对AI工具的体验认知。如果说以前的Agent更多只是没“脑子”的工具,
但与此同时,我们2026年4月26日看到了不少过于吹捧的自媒体报道,跟着Manus团队一起提前“”了,称其“AGI的里程碑”;当然,也不乏有人指出其产品“套壳”,团队人物存在“黑历史”,技术栈和实现方式缺乏真正的自主创新。
我们应该批评Manus什么?毫无疑问,号称“只是发一个demo”,以没准备好应对用户**的服务器资源为说辞,制造一种营销的“”,随后又对外界**,使得人们难以探知真相,满足好奇心。
但我想,无论这个产品以公测还是正式发布的方式,一切的维护和贬损都没有太大意义。
早已离开了学术科研的襁褓,和大公司的**。企业航母all in AI难保一帆风顺,现有的开源、半公开,付费、收费的工具比比皆是,只要不违反相应的开源**证规则和商业**协议,任何人都可以充分且自由地利用它们,无论出于纯粹的个人使用,还是做拼装组合叠加的“套壳”式创新。
更别提这个“创新”的结果还挺好玩(就算拿不到邀请码,你也可以去网站上感受几十个现成的use cases)。
好玩的东西,在这个时代太稀缺了。脑洞谁都能开,填得上才是王道。






发表评论