Manus横空出世:中国首款通用AI代理刷屏朋友圈!
创始人
2025-03-06 14:40:34
0

Manus在GAIA基准测试中取得了最高分,标志着其作为一款高度先进的通用AI助手的地位。

3月6日,在苹果新品发布的同时,很多人为了拿到Monica.im研发的世界首款AI Agent产品Manus的邀请码而通宵达旦。Manus在GAIA基准测试中取得了最高分,标志着其作为一款高度先进的通用AI助手的地位。

朋友圈几乎被Manus刷屏,上一次出现类似情景还是在GPT和DeepSeek发布时。二级市场已经注意到Manus,阿里、腾讯等股票在开盘后迅速上涨。昨晚美股交易时段,相关逻辑已经显现,ADR(美国存托凭证)市场也有所反应。

与传统AI模型不同,Manus不仅能够生成想法,还能在现实世界中执行任务,使其能够自主完成复杂任务。一项演示展示了其撰写报告和创建定制化表格的能力。这款AI代理还配备了高度自适应的“数字大脑”,能够进行独立学习、处理复杂指令并实现跨领域协作。

据其团队介绍,Manus是一款真正自主的AI代理,能够处理各种复杂和动态的任务。与传统AI助手不同,Manus不仅提供建议或答案,还能交付完整的任务结果。

Manus采用由多个独立模型驱动的多签名(multisig)系统。这意味着Manus的核心功能由多个独立的AI模型共同完成。每个模型可能专注于不同的任务或领域,例如自然语言处理、数据分析、推理等。这些模型协同工作,能够处理更复杂、多样化的任务,同时提高系统的鲁棒性和准确性。今年晚些时候,官方计划开源部分模型,特别是Manus的“后处理”(推理)部分。

据了解,Manus采用了“虚拟机 + 计算使用 + 生成物(artifacts) + 内置多个agents”的综合架构。可以理解为在类似Cursor的产品上增加了一层外壳,并整合了多个小模型。Cursor类产品对普通人门槛较高,而Manus降低了使用门槛。

目前业界普遍采用类似思路,OpenDevin等团队也有类似产品。Claude在处理此类任务时表现也很强。如果这种模式跑通,Coze、Dify等产品也可能推出类似路线,同时这类能力可能被大模型内化。

与Manus同时受到关注的,还有一个4分钟的演示demo。在这些案例中,Manus自主完成了从规划到执行的整个过程,展示了真正的代理能力,而非简单的助手功能。

例如,第一个任务是从15份简历中筛选出适合强化学习算法工程师职位的候选人。Manus展现出类似人类实习生的特质,手动解压文件并逐页查看每份简历,同时记录关键信息。官方团队表示,所展示的只是Manus能力的冰山一角。

当AI Agent通过调用长链思维和工具利用,最终输出一个完整且专业的结果时,用户开始惊叹于AI真正能够帮助人类完成任务。

为确保结果的可重复性,Manus使用了与其官方版本相同的配置进行评估。

据官网介绍,在GAIA基准测试(评估通用AI助手解决现实世界问题的能力)中,Manus在所有三个难度级别上都达到了新的最先进(SOTA)性能。

Manus AI背后的创始人肖弘毕业于华中科技大学软件工程专业。毕业后,他开启了一系列创业之旅,2015年创立了夜莺科技,并推出了壹伴助手和微伴助手,服务超过200万B端用户,获得了腾讯、真格基金等投资。

他还开发了Monica,一款被称为“全能”的AI助手产品,最初作为浏览器插件推出。通过整合主流大模型(如Claude 3.5、DeepSeek等),Monica提供聊天、翻译、文案撰写等功能。Monica最初专注于海外市场,用户数突破百万,成为AI插件领域的领先产品。今年2月,Monica中文版开始内测,目前对国内用户免费开放。该版本基于DeepSeek R1和V3模型,具备深度推理能力,支持记忆功能和实时互联网搜索。

Manus秉持“少结构多智能”的技术理念,这与主流观点有所不同。他们认为,当数据质量足够高、模型足够强大、架构足够灵活、工程足够稳健时,计算机使用、深度研究、编码代理等能力自然会涌现,无需将其设计为特定的产品功能。

相关内容

热门资讯

推动人工智能与实体经济深度融合... 7月28日,2025人工智能产品应用博览会在苏州工业园区开幕。本届智博会以“智无界·慧共生”为主题,...
原创 郭... 在6月17日,令人期待的《此处通往繁星》开机现场,两位主角郭麒麟与张雪迎并肩而立,仿佛两个世界的连接...
记者观察:大模型行业应集各家所... 在近日举行的2025世界人工智能大会上,记者发现大模型行业出现了一个有趣的现象:同行非但没有成为冤家...
宜兴农商银行完成ATM信创改造... 在金融科技飞速发展的今天,数据安全成为银行运营中不可忽视的重要环节。宜兴农商银行近期完成的ATM信创...
宁德时代获得发明专利授权:“一... 证券之星消息,根据天眼查APP数据显示宁德时代(300750)新获得一项发明专利授权,专利名为“一种...
联想AI基础设施新品落地长沙,... 数据显示,2021年长沙数字经济总量突破4000亿元,位居全国第12位;至2023年,全市数字经济核...
美图秀秀、美颜相机2025上半... 在2025年的移动互联网领域,美图公司再度展现了其强大的市场影响力。据QuestMobile最新发布...
SuperCLUE测评榜单第一... 今年6月,工业和信息化部在审议《工业和信息化部信息化和工业化融合2025年工作要点》时,明确提出要实...
依托Qwen多模态大模型,工行... 移动支付网消息(欧文):银行业正积极推进人工智能大模型在金融领域应用。近日,工商银行为解决商户准入审...
聚焦WAIC 2025|数据标... (记者 张苏慧)7月26日-29日,WAIC 2025在上海举行。在中国电信展台上,“方言语音高质量...