大数据百家讲坛:DeepSeek、Manus与AI+Agent行业现状

【主题】【直播平台】 精彩活动预告p 2025年4月12日 人工智能通识课程教学改革与创新论坛 成都《一本书读懂 AI Agent》扫码进入社群获取讲座预告下载专家 PPT本期公益前沿讲座直播间福利王吉伟 专家p 研究AIGC、AlAgent及超自动化p 撰写Al Agent的深度文章数十篇p 中国信息通信研究院评为“RPA产业推进方阵优秀自媒体p 《一本书读懂AlAgent》作者《DeepSeek、Manus与AI Agent行业现状》王吉伟 大数据百家讲坛第135期2025.03.29王吉伟,《一本书读懂AI Agent:技术、应用与商业》作者,AIGC&超自动化分析师,知名科技博客王吉伟频道创始人。多年来持续关注互联网+、IoT、产业互联网、产业升级及数字化转型,专注业务流程、人工智能、超自动化与RPA,致力于探索IOT时代产业升级新机会,为企业经营和创业创新提供前沿技术、商业模式及方法论的解读与分享。目前重点观察与研究AIGC、AI Agent及超自动化在各行业的落地应用与创业创新。已撰写各类文章上千篇,作品见诸内容平台、学术网站及杂志。前言:什么是AI AgentDeepSeek等推理模型对AI Agent的影响Manus通用智能体带来的行业启示AI Agent行业现状AI Agent如何影响企业经营前言:什么是AI Agent2023年3月AutoGPT横空出世,7月OpenAI的翁丽莲发表名为 《LLM Powered Autonomous Agents》的博文,详细介绍基于LLM的AI Agent,给出了AI Agent的理想技术架构。关于AI Agent(智能体)的概念很多,很多组织都给出了定义l 业务角度:AI Agent是完全自主的系统,可以在较长时间内独立运行,使用各种工具来完成复杂的任务。l IBM:AI Agent是指能够通过设计其工作流程并利用可用工具代表用户或其他系统自主执行任务的系统或程序。l Salesforce:AI Agent是一种人工智能 (AI) 系统,无需人工干预即可理解和响应客户查询。l Zapier:AI Agent是可以在环境中自主操作的实体。它可以从周围环境中获取信息,根据这些数据做出决策,并采取行动来改变这些环境 - 物理、数字或混合环境。l Anthropic:Agent是LLM动态指导自己的流程和工具使用的系统,保持对如何完成任务的控制。详见图书第2.2.3小节今天我们所说的主要是基于大语言模型的AI Agent(LLM based Agent),其最简单的表达式如下:感知:AI Agent 从环境中收集信息并从中提取相关知识的能力。 规划:AI Agent 为了某一目标而做出决策的过程。 行动:AI 基于环境和规划做出的动作基于大语言模型的AI AgentPPA:感知( Perce- ption)→ 规划(Planning)→ 行动(Action)由复旦大学NLP团队提出的AI Agent 定义已经得到产学研等各界的认可。AI Agent是一种能够感知环境、进行决策和执行动作的智能实体。详见图书第2.2.2小节基于大语言模型的AI Agent(LLM Based Agent)任务型对话Agent 开放域对话Agent知识问答Agent……对话型Agent个人助理Agent 工作助理Agent 教育助理Agent……智能助理Agent商品推荐Agent 内容推荐Agent 社交推荐Agent……推荐类Agent更多类型Agent参考图书第1.3节PPA表达式看着简单,实则包括万象:感知:视觉、听觉、嗅觉、味觉、触觉、平衡感……规划:目标设定、信息收集、问题分析、方案生成、决策制定、资源分配……行动:利用技术工具、合作与沟通、创新思维、分步执行、适应性行动……感知、规划与行动的每一个元素与维度,对应于智能体都是具体的应用场景,这些元素、维度与场景都可以无限的细分与挖掘。每一个元素、维度与场景的实现都会用到相应的技术、工具与资源,会催生出大量的技术、产品、解决方案与响应的企业,产业链上各个玩家均能受益。2023年3月AutoGPT横空出世,7月OpenAI的翁丽莲发表名为 《LLM Powered Autonomous Agents》的博文,详细介绍基于LLM的AI Agent,给出了AI Agent的理想技术架构。关于AI Agent(智能体)的概念很多,很多组织都给出了定义l 业务角度:AI Agent是完全自主的系统,可以在较长时间内独立运行,使用各种工具来完成复杂的任务。l IBM:AI Agent是指能够通过设计其工作流程并利用可用工具代表用户或其他系统自主执行任务的系统或程序。l Salesforce:AI Agent是一种人工智能 (AI) 系统,无需人工干预即可理解和响应客户查询。l Zapier:AI Agent是可以在环境中自主操作的实体。它可以从周围环境中获取信息,根据这些数据做出决策,并采取行动来改变这些环境 - 物理、数字或混合环境。l Anthropic:Agent是LLM动态指导自己的流程和工具使用的系统,保持对如何完成任务的控制。详见图书第2.2.3小节大模型聚焦语言处理,以文本交互被动响应指令,应用于内容生成等场景;AI Agent以LLM为核心,具备多模态交互和自主执行能力,可完成跨场景复杂任务。还有很多人在问,AI Agent与大模型的区别。两者的区别,可以体现在以下几个方面:l 定义与目标 :大模型(如GPT)专注语言理解与生成,通过海量数据训练掌握文本处理能力;AI Agent以LLM为“大脑”,能自主感知环境、规划任务并执行动作,实现复杂任务闭环。l 核心能力 :大模型被动响应指令,以文本交互为主;AI Agent主动执行任务,具备多模态交互(语音/图像)、动态学习和工具调用能力(如API操作)。l 应用场景 :大模型用于内容生成、客服问答;AI Agent应用于供应链优化(阿里仓储Agent)、医疗分诊(腾讯车载系统)、实时决策(自动购物)等跨场景任务。l 技术实现 :大模型依赖Transformer架构与高算力;AI Agent需叠加规划、记忆模块及工具接口,形成“感知-决策-行动”闭环。l 局限性 :大模型无法自主执行跨场景任务;AI Agent需解决工具可靠性(API兼容性)和动态环境适应(任务中断处理)等工程难题。030201AI Agent的终极设计目标是要打造真正自主执行各种任务并能够学习进化的智能体,但限于当前大语言模型及AI Agent本身的技术限制,目前还达不到这个目标。多智能体(multi-agent)也是智能体在复杂业务场景应用的解决方案,把一个复杂场景分解为多个简单任务,让不同角色的智能体去执行不同的任务,并且这些任务还可以无限的细分下去,让更多的智能体调用不同的工具去执行,进而产生了智能体网络(Agentic Web),并衍生出群体智能(Swarm Intelligence)。要解决这个问题,要么实际把大场景跨应用的业务细分化,针对细分场景设计智能体,因此产生了垂直智能体。垂直智能体可以垂直于业务场景,也可以垂直于一行细分领域,但垂直于一个领域的

立即下载
综合
2025-04-01
厦门大学数据库实验室
56页
10.77M
收藏
分享

[厦门大学数据库实验室]:大数据百家讲坛:DeepSeek、Manus与AI+Agent行业现状,点击即可下载。报告格式为PDF,大小10.77M,页数56页,欢迎下载。

本报告共56页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共56页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
图表 15 全球金本位制复辟下的黄金价格模拟
综合
2025-04-01
来源:【宏观专题】五种极端情形下的金价推演:黄金“狂想曲”
查看原文
图表 14 全球金本位制的历史演进
综合
2025-04-01
来源:【宏观专题】五种极端情形下的金价推演:黄金“狂想曲”
查看原文
图表 13 陷入全球性军事对抗时的黄金价格模拟
综合
2025-04-01
来源:【宏观专题】五种极端情形下的金价推演:黄金“狂想曲”
查看原文
图表 12 黄金是天生的热战赢家
综合
2025-04-01
来源:【宏观专题】五种极端情形下的金价推演:黄金“狂想曲”
查看原文
图表 11 储备货币易主时的黄金价格模拟
综合
2025-04-01
来源:【宏观专题】五种极端情形下的金价推演:黄金“狂想曲”
查看原文
图表 10 全球主流储备货币对黄金贬值历程
综合
2025-04-01
来源:【宏观专题】五种极端情形下的金价推演:黄金“狂想曲”
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起