走进人工智能2.0
第1页一、人工智能的前世今生二、大模型的原理和能力边界三、大模型的现状和发展:技术应用和人才要求学习交流可加微信号:zhixingzhaizhuren走进人工智能2.0肖睿2025年8月14日 杭州• 北大青鸟人工智能研究院• 北大计算机学院• 北大教育学院学习科学实验室第2页一、人工智能的前世今生二、大模型的原理和能力边界三、大模型的现状和发展:技术应用和人才要求学习交流可加微信号:zhixingzhaizhuren走进人工智能2.0一、人工智能的前世今生二、大模型的原理和能力边界三、大模型的现状和发展:技术应用和人才要求第3页一、人工智能的前世今生二、大模型的原理和能力边界三、大模型的现状和发展:技术应用和人才要求学习交流可加微信号:zhixingzhaizhuren人工智能的前世今生:1956-2025n 人工智能:Artifacial Intelligence,AIØ 1956年:让机器具备人类智能,AGI,达特茅斯会议Ø 2022年:让机器具备超人类智能(非人类智能),ASI,chatGPT发布n 人工智能发展的4个时代1. 古代(1956-1996):通过规则和知识让机器具备人类智能2. 近代(1996-2006):通过数据和学习让机器具备人类智能3. 现代(2006-2020):通过神经网络和深度学习让机器具备人类智能4. 当代(2020-2025):通过大模型让机器具备人类智能和超人类智能(非人类智能)第4页一、人工智能的前世今生二、大模型的原理和能力边界三、大模型的现状和发展:技术应用和人才要求学习交流可加微信号:zhixingzhaizhuren人工智能0.0:古代(1956-1996),规则和知识时代Ø第一次浪潮(1956-1968):规则推理•思想准备:冯诺依曼计算机、机器思考、图灵测试•哲学基础:唯理论•主要原理:制定规则,进行数理推理(确定性,不确定性的概率)•主要成就:下棋程序,定理机器证明,MIT的搬箱机器人Ø第二次浪潮(1986-1996-?):知识推理•哲学基础:唯理论+经验论•主要原理:知识工程(知识抽取和知识表达),专家系统(知识库+推理机)•主要成就:石油勘探、气象预报、军事决策、经济预测等;包括1996年之后的深蓝国际象棋、WatsonØAI=IT:这个时代,人工智能基本等同于软件程序第5页一、人工智能的前世今生二、大模型的原理和能力边界三、大模型的现状和发展:技术应用和人才要求学习交流可加微信号:zhixingzhaizhuren人工智能0.1:近代(1996-2006),机器学习时代Ø第三次浪潮(1996-?):机器学习(数据+学习),小数据集,特征工程•使用统计学习方法建模,三个核心要素:模型、目标、策略ü模型是核心:逻辑回归,决策森林,支持向量机,马尔科夫链,人工神经元……ü建模方法从规则到学习:从数学模型(分析数学),到数据模型(计算数学)ü数据模型的能力边界:可以用数据模型模拟世界(数字化、全景化),以史为鉴(IID)•主要成就:风险识别(金融、工业、经济)、学术研究Ø连接主义(1946-2006):神经网络模型(黑盒)•属于机器学习的一种方法,模型采用的是人工神经网络ü人工神经网络与人脑最大的共同点是名字(原理、机制和架构并不一样),用神经网络表达数学模型ü传统神经网络:霍普菲尔德网络,玻尔兹曼机,…..ü深度神经网络:深度学习(Hinton,2006)Ø软件2.0:人工智能是数学、物理学、计算机科学的混合体第6页一、人工智能的前世今生二、大模型的原理和能力边界三、大模型的现状和发展:技术应用和人才要求学习交流可加微信号:zhixingzhaizhuren人工智能1.0:现代(2006-2020),深度学习时代Ø传统深度学习(2006):深度神经网络模型,中数据集,端到端•多种神经网络模型:DBN,CNN,RNN,ResNet,Inception,RWKV, ……üAlphaGO:2016年超过人类棋手üImageNet:2017年超过人眼üAlphaFold:2022年超过人类科学家,2024年获得诺贝尔奖•主要成就:人脸识别、图像识别、语言翻译、语音识别、物理建模……Ø现代深度学习(2017):Transformer模型,大数据集,注意力机制(大规模并行)•三种Transformer模型架构:并行矩阵计算(GPU):堆叠架构,容易扩展ü编码器(BERT):embedding,Ernie1.0, ……ü混合网络: T5、GLM(早期)ü解码器(GPT):生成式人工智能(AIGC),大力出奇迹(大模型,2020)第7页一、人工智能的前世今生二、大模型的原理和能力边界三、大模型的现状和发展:技术应用和人才要求学习交流可加微信号:zhixingzhaizhuren人工智能2.0:当代(2020-2025),大模型时代Ø模型服务(2020):MaaS•全部是Transformer的GPT架构(解码器):生成式人工智能(AIGC)•大模型:预训练,生成-理解-决策(RL)ü大(数据多、参数多、算力多):B级(Billion,10亿)ü模型:语言、视觉、多模态pTransformer:大语言模型(LLM,大模型),多模态模型ChatGPT(5、4.1、4o、o1、o3、o4)、Claude;Grok、Gemini;Llama、 ……DeepSeek、Step、Qwen;Kimi、MiniMax;GLM、火山(豆包)、元宝、百度……pTransformer+Diffusion:视觉模型图像: Stable Diffusion、Mid-Journey、DALL.E等视频: Sora、可灵、即梦、Vidu、海螺、veo等ü模型:通用模型 vs 垂直模型(行业模型)p接近成熟:传媒、广告、编码、电商等p正在发展:教育、医疗、金融、工业、农业等第8页一、人工智能的前世今生二、大模型的原理和能力边界三、大模型的现状和发展:技术应用和人才要求学习交流可加微信号:zhixingzhaizhuren人工智能2.0:当代(2020-2025),大模型时代ØAgent(2025):大模型是新手机,Agent就是app•大模型的应用已从简单的对话工具(chatGPT、豆包)进化为:任务导向、交付结果的Agent(Manus、Lovart、Lovable等)•Agent的核心架构是:感知(多模态)、决策(LLM;记忆、检索、上下文)、动作(具身驱动、工具调用)•Agent的核心特征是自主(请人类走开):从human in loop到human on loop人类设立任务目标AI对其中某(几)个任务提供信息或建议人类自主结束工作人类设立任务目标AI完成其中某(几)个流程的初稿人类修改调整确认人类自主结束工作设立目标提供资源监督结果全权代理任务拆分工具选择进度控制自主结束工作Embedding:助手模式人类AI人类完成绝大部分工作Agent:代理模式人类AIAI完成绝大部分工作Copilot:伙伴模式人类AI人类和AI协作工作第9页一、人工智能的前世今生二、大模型的原理和能力边界三、大模型的现状和发展:技术应用和人才要求学习交流可加微信号:zhixingzhaizhur
[北京大学]:走进人工智能2.0,点击即可下载。报告格式为PDF,大小38.63M,页数53页,欢迎下载。
