马根明:百度文心智能体开发实战与分发模式创新
Agent开发实战与分发模式创新演讲人:马根明目 录01引言02Agent开发实战03分发模式创新04安全与隐私保护05总结与展望01引言Agent(智能体)是什么智能体是一种在大语言模型基础上构建的智能实体,拥有自主思考和行动的能力。智能体就像一个聪明的助手,能够深度理解你的需求,甚至拆分子任务,并调用各种工具扩展自身能力,从而完成你的各种具体指令。自主性无需人工干预,具备自主探索和决策能力反应性先思考后行动,能快速应对环境中的变化和刺激主动性不止于应对环境变化,能推理、计划和行动,来实现特定目标社交能力可以与其他智能体(包括人类)进行交互Agent智能体Tools工具Planning推理规划Memory记忆Action执行短期记忆长期记忆日历计算器代码解释器搜索···思维链自检子目标拆解深度思考Agent 和LLM(大模型)的区别在于,大模型与人类之间的交互是基于prompt 实现的,用户prompt 是否清晰明确会影响大模型回答的效果。而Agent的工作仅需给定一个目标,它就能够针对目标独立思考并做出行动。智能体是如何运行的帮我做一个去上海玩的攻略请问您计划去多久,和谁一起这周末吧智能体常见场景【生活助手】爸妈防骗助手【互动游戏】庆余年密室逃脱【人物角色】苏轼【领域专家】农民院士智能体【提效工具】TreeMind树图【学习】读书专家【图创】创客贴海报设计助手【文创】悟智智文助手AI的发展给各行各业带来巨大的机遇和挑战02Agent开发实战(文心智能体)文心智能体平台AgentBuilder是基于文心大模型的智能体构建平台,提供自然语言创建智能体的开发新范式。支持广大开发者根据自身行业领域、应用场景,采用多样化的能力、工具,打造大模型时代的智能体。并为开发者提供百度生态+域外分发路径和多元的商业机会,助力开发者完成商业闭环,是“开发+分发+运营+变现”一站式智能体赋能平台。开发难度低调优迭代快分发渠道广商业可闭环官网: agents.baidu.com文心智能体整体架构图入驻管理基础能力Agent(智能体)开发文心大模型:EB3.5/4/speed等文心系列模型 模型业务功能向量数据库开发能力知识库管理文件解析段落分割向量加工向量检索Embedding SDKGDP SDK核心服务基础业务服务(帐号, 交易等)Assistant API(上下文, 知识增强, tools)Tools(原plugins)分发管理数据分析经营/运营能力调优站内信消息Prompt管理版本管理调式能力推荐生成智能优化可视化开发开发画布调式预览应用部署三方组件调试与测试全流程trace测试集管理质量与安全机审能力效果评估巡检能力风控能力内容风控中台大模型中台全链路监控LUI交互操作服务Function Call 召回调式与日志服务服务API管理一站式服务托管基于LUI进行全流程开发代码生成部署发布运行接入SDK/Open APILLMAPI云服务生态服务多语言/跨平台协议规范标准协议解析组件库布局系统设计系统宿主通信开发工具idata/ievalue调试标记百度公有云基础设施文心智能体设计范式任务描述对话文心一言工具记忆Zeroshot Prompt观测PlanReActZero-shotReAct任务描述对话文心一言工具记忆Fewshot Prompt观测思考Think任务描述对话文心一言工具记忆Fewshot Prompt观测规划Think思考Plan PromptPlan一切都是工具检索增强indexingQueryRetrievalLLMFileParserLLM文件对话LLM PlanRetrievalCode-interpreterLLM Generate工具基于工具的任务规划开发新范式:“一句话”开发智能体输入你的idea要做一个什么设定的角色,或想要解决什么问题数据库知识库多尺寸模型模板复制数字形象官方插件长期记忆商业链接你的智能体生成你的智能体平台能力支撑自动生成设定、勾选配置,快捷创建智能体调优迭代快:可成长的智能体开发者根据诊断建议进行调优分 发智能体诊断调优冷 启创 建Prompt优化知识库优化工具集优化分发冷启动界定能力范围效果评估反馈用户动作反馈正负向case分析能力拓展模型升级LGUI交互支持文、图、表、视频的动态化渲染新加坡文旅智能体案例03分发模式创新分发渠道广:全域智能分发自然结果满足搜索精准寻址AI助手微信小度(含旗下添添系列)Agent分发中的问题筛选优化:评估促进Agent进化深度刻画:准确刻画Agent的能力精准匹配:将Query调度到最优AgentQueryAgent 评估Agent 理解Agent 调度Agent评估好的评估机制•与产品的相关性高•可解释性好•成本低、速度快Train DataEval DataProd Test Data传统模型评估问题:训练数据的分布不可知,产品与训练数据分布差异较大评估集人工评估聚合打分人工评估问题:评估集异常庞大、成本高、速度慢Agent评估LLM-EvalHuman-EvalAuto-EvalUser-Feedback前向:•LLM泛化评估集•LLM自动评估•人工评估校验后向:•用户反馈信号•自动评估•开发者优化评估效果、成本和速度的平衡Agent理解链接分析内容理解网页理解时效性质量权威性• Agent内容是动态生成• Agent的能力边界模糊• Agent可进化/退化Agent Data流式理解语义多表征Agent理解通过多维表征来刻画Agent能力问题:Agent调度需求识别泛化理解Agent调度Agent2Agent3Agent1需求理解检索调度多表征语义索引Agent召回Agent排序如何打造一个好的智能体 - 新加坡旅游局智能体创建步骤1. 设定智能体能力边界•边界清晰、功能明确•能力重点突出•设定评估集合2. 根据功能边界拆分能力点•私有数据、私有工具•共享工具能力3. 完成能力点4. 创建智能体、初版调优5. 评估智能体效果•根据评估集合6. 拆分case•分析case问题,并定位7. ⑥ → ② 8. 发布 后 持续运营知识库1.所有文旅公众号内容2.官方政策类信息插件1. 景点查询2. 攻略查询3. 休闲娱POI点查询4. 酒店查询5. 城市景点榜单查询创建知识库、插件、工作流延展智能体边界文旅分发全流程跨平台兼容性与标准化问题多端创建、多端分发:文心智能体平台和三方智能体作为智能体生产端,采取统一协议,分别供给搜索和第三方进行智能体分发。一体多端方案文小言一言web小度星河社区华为三星智能体生产创建调优审核经营三方智能体巧舱千帆Appbuidler文小言垂类/其他接入服务入驻API对话API输出API搜索分发输出智能体端/H5智能体分发服务输出智能体H5嵌入交互SDK分发服务AgentProxy3个API和2个SDK•入驻API:统一Agent的Meta信息,抹平创建端差异•输出API:将可分发的Agent输出给多个分发渠道•对话API:通过统一的对话协议,调起多端创建的Agent•交互SDK:提供默认兜底的Agent交互效果•监听SDK:非平台Agent落地页上传对话信息用以优化分发效果落地页嵌入监
马根明:百度文心智能体开发实战与分发模式创新,点击即可下载。报告格式为PDF,大小6.25M,页数41页,欢迎下载。



