Manus AI智能体:AGI发展新范式的实践与测评
Manus AI智能体AGI发展新范式的实践与测评智昇人工智能研究院研究员@金金、Enjoy、小雪、IRIS、何惠学君、阿秒AI团队130所高校教授、博士联合发布智昇人工智能研究院 2025-03-07contents目录• 引言• AGI发展历程、现状与趋势• Manus AI 概述• Manus AI 技术原理探析• Manus AI 实测案例分析• Manus AI 用户体验评估• Manus AI 发展前景与挑战• Manus AI 交互指南• 写在最后引言人工智能正经历深刻变革,从传统的单点能力模型正快速向通用人工智能(AGI)演进。在这一演进过程中,AI智能体(Agent)的出现代表了AI从“工具”向“助手”再到“代理人”的关键跃迁。2024年末到2025年初,我们见证了AI智能体从概念走向实践的在当前以OpenAI、Anthropic等为代表的国际AI巨头主导的格局中,来自中国的Manus AI团队凭借其创新产品吸引了广泛关注,为全球AI智能体的发展带来了新的可能性和思路。重要时刻。自ChatGPT掀起大语言模型革命以来,AI已能进行高质量的文本理解与生成,但其与现实世界的交互能力仍显不足。人类与AI之间的交互依然需要人类作为中介,负责操作各类软件和执行实际任务。这种情况正随着AI智能体的出现而改变。Manus AI作为新兴的通用智能体,其核心价值主张在于模拟人类操作电脑的能力,实现从“我告诉AI做什么”到“AI能够自己完成任务”的转变。这种能力不仅是技术上的进步,更是AI与人类协作模式的革新,标志着AGI发展的新阶段。01AGI发展历程、现状与趋势AGI发展历程AGI的理念源于对机器能像人类一样执行任何智力任务的追求,其历史可分为几个关键阶段。早期探索与乐观估计(1950年代-1960年代)1956年的达特茅斯研讨会被视为AI研究的起点,吸引了John McCarthy、Marvin Minsky等学者,探讨机器学习和通用智能的可能性。1965年,赫伯特·西蒙预测机器将在20年内能完成人类任何工作。1967年,Marvin Minsky认为AGI问题将在一代人内解决,但这些预测未实现,反映了早期对复杂性的低估。 转向狭窄AI(1970年代-1990年代)1970年代初,研究者意识到AGI难度,资金转向应用导向的狭窄AI。1984年,Doug Lenat启动Cyc项目,试图构建通用知识库,1980年代初日本的第五代计算机项目也设定了包括自然语言和推理的AGI目标,但未能实现,AI研究者被贴上“空想家”标签,避谈“人类水平”AI。 AGI发展历程AGI兴趣复兴(1990年代末-2000年代)1997年,Mark Gubrud在军事生产讨论中首次使用“AGI”一词。2000年,Marcus Hutter提出AIXI模型,描述一个能最大化目标满足的通用AI代理。2002年,Peter Voss、Shane Legg和Ben Goertzel推广该术语。2009年厦门大学和OpenCog在厦门举办首次AGI暑期学校,标志着研究社区的活跃。现代AGI研究与进展(2010年代-至今) 2010年,DeepMind成立,专注于AGI,2014年被Google收购。2015年,Elon Musk等创立OpenAI,致力于安全AGI。2016年,DeepMind的AlphaGo击败围棋世界冠军,展示AI在复杂策略游戏中的能力。2022年,OpenAI推出ChatGPT,标志自然语言处理的新里程碑。2023年,微软研究认为ChatGPT可能是早期AGI。2024年OpenAI的o3模型在ARC-AGI基准测试中得分87.5%,超越人类84%,进一步推动AGI研究。从人工智能的技术代际发展看第一阶段:数据启蒙期(1950s-2010s)•1997年IBM深蓝击败国际象棋世界冠军卡斯帕罗夫•2000年代自动语音识别系统的商业化应用•2010年左右机器学习在图像分类等任务上的突破第二阶段:互联网融合期(2010s-2025s) •2012年深度神经网络在ImageNet挑战赛中的突破性胜利•2017年Transformer架构的提出,为大型语言模型奠定基础•2022-2023年GPT、Claude和Llama等大语言模型的广泛应用。从人工智能的技术代际发展看第三阶段:感知觉醒期(2025s-2030s)•多模态大模型能无缝融合文本、图像、声音、视频等不同形式的信息•感知-行动循环的建立,使AI能够通过持续观察调整其行为•实时环境理解和场景重建能力•初步的物理常识和因果推理能力第四阶段:实体化探索期(2030s-2040s))•灵巧机器人系统与大模型的深度集成•强大的物理操作能力,包括精细运动控制和工具使用•环境适应性和自主学习新技能的能力•在不确定环境中的长期规划和决策能力第五阶段:社交共融期(2040s+) •社会认知能力,包括理解情绪、意图和社会规范•文化理解和适应能力•道德推理和伦理决策能力•与人类的深度合作能力和自我完善机制智能体(Agent)在AGI进化中的关键地位AI智能体是能自主执行任务的软件程序,通过观察环境、决策和行动实现目标。它们被视为AGI发展的关键,因为能处理需要通用智能的任务,如上下文理解、决策和环境交互。智能体的类型包括:自主机器人:如Roomba吸尘器和Amazon配送机器人。游戏智能体:如下棋或扑克智能体。欺诈检测智能体:用于金融交易分析。交通管理智能体:优化城市交通流结合大型语言模型(LLMs),智能体的能力显著增强。例如,Microsoft的研究表明,LLMs使智能体能更自然地与用户交互,处理复杂任务(如代码生成和客户查询解决)。研究还指出,智能体通过迁移学习和单次学习(one-shot learning)提升通用性,例如更快适应新任务。它们被视为AGI的构建模块,推动从单一功能AI向多领域适应的转变。Manus AI的出现与定位Manus是由中国团队Monica.im于2025年3月5日发布的全球首款通用型AI Agent(智能体)产品,在权威的GAIA基准测试中性能超越OpenAI同类产品。产品定位Manus定位于"手脑并用"(拉丁语Mens et Manus),采用多代理架构模拟人类工作流(Plan-Do-Check-Act),成本仅为同类产品的十分之一。用户只需输入简单指令,即可获得接近实用状态的报告或文档。创始人团队肖弘(Red):1992年出生,华中科技大学毕业生,连续创业者。创业历程:2015年创立夜莺科技,推出微信公众号运营工具"壹伴助手"和"微伴助手",累计服务超200万B端用户,获腾讯、真格基金等数亿元投资。2022年创立Monica(北京蝴蝶效应科技),开发AI浏览器插件,主打海外市场,用户突破千万。2025年推出Manus,被媒体称为"比DeepSeek创始人更年轻的AI新星"。季逸超(Peak Ji)联合创始人兼首席科学家,曾开发获MacWorld特等奖的iOS浏览器"猛犸",并创建中文互联网最大知识图谱系统Magi。主导Manus的技术架构设计,强调人机协作的未来方向。张涛:资深AI产品经理,负责产品场景探索与演示视频制
[智昇人工智能研究院]:Manus AI智能体:AGI发展新范式的实践与测评,点击即可下载。报告格式为PDF,大小9.09M,页数89页,欢迎下载。