2022中国大模型发展白皮书

2022中国大模型发展白皮书⸺元能力引擎筑基智能底座本研究由百度支持IDC观点前言1.1 大模型发端及内涵1.2 国家政策推动中国大模型加速发展大模型成为AI开发新范式2.1 人工智能发展的挑战与阻碍2.2 大模型带来AI开发新范式大模型加速产业智能化变革3.1 大模型带来AI技术与应用变革潜能被广泛验证3.2“模型+工具平台+生态” 三级协同加速产业智能化3.3 大模型加深度学习平台正在成为产业智能化基座大模型的评估与典型市场参与者4.1 产业生态图谱4.2 大模型评估框架及评估结果4.3 百度文心大模型大模型未来发展趋势5.1 大模型的发展是大势所趋5.2 对行业用户的建议5.3 对大模型供应商的建议010202030606091212151619192022333334350102030405CONTENTS目录随着数字化转型需求增长,AI在企业中的应用也越来越多,AI开发门槛高、应用场景复杂多样、对场景标注数据依赖等问题成为AI规模化落地的挑战,而预训练大模型的出现则为人工智能带来了新的机遇与希望。大模型作为政府和企业推进人工智能产业发展的重要抓手,在识别、理解、决策、生成等AI任务的泛化性、通用性、迁移性方面都表现出显著优势和巨大潜力。具体来看:大模型具有良好的通用性、泛化性,显著降低人工智能应用门槛。预训练大模型在海量数据的学习训练后具有良好的通用性和泛化性,用户基于大模型通过零样本、小样本学习即可获得领先的效果,同时“预训练+精调”等开发范式,让研发过程更加标准化,显著降低了人工智能应用门槛,成为AI走向工程化应用落地的重要手段。深度学习平台为预训练大模型的发展保驾护航,两者结合夯实了产业智能化基座。深度学习平台是推动产业智能化转型升级的核心载体,为大模型的算法开发、训练、部署保驾护航。大模型加上深度学习平台,贯通了从硬件适配、模型训练、推理部署到场景应用的AI全产业链,夯实产业智能化基座,将加速产业智能化升级。大模型在推进产业智能化升级中已表现出巨大潜力,企业应该尽早关注。大模型目前的产业应用包括面向企业提供AI中台基座、深度定制支持产品或生产的优化与创新、开放模型服务等。大模型已经在搜索、推荐、智能交互、AIGC、生产流程变革、产业提效等场景表现出巨大的潜力,企业应该尽早关注,在业务中布局。未来还需加强大模型与真实场景需求匹配,推动大模型大规模落地。目前中国大模型厂商在模型布局方面较为完善,应进一步围绕行业赋能的广度和深度持续探索,不断夯实基于大模型的产品建设,推动大模型技术从实验室走向实际大规模落地。IDC观点IDC预测未来大模型将带动新的产业和服务应用范式,在深度学习平台的支撑下将成为产业智能化基座,企业需加快建设人工智能统一底座,融合专家知识图谱,打造可面向跨场景或行业服务的“元能力引擎”。— 01 —人工智能显著的溢出效应加快推进了新一轮科技革命,也带动了其他技术的进步。随着产业应用的深入、场景复杂度提升,随之而来的是数据的爆发式增长、算法的飞速更新迭代、算力的消耗指数上升,这些都对人工智能的发展提出新的要求。1.1大模型发端及内涵随着人工智能赋能实体经济进入深水区,企业通常面临数据资源有限、算力投资难度大、高水平人才稀缺的发展瓶颈。大模型作为解决上述问题的最优路径之一,可极大降低企业的技术门槛和开发成本。IDC定义下的AI大模型是基于海量多源数据打造的预训练模型,是对原有算法模型的技术升级和产品迭代,用户可通过开源或开放API/工具等形式进行模型零样本/小样本数据学习,以实现更优的识别、理解、决策、生成效果和更低成本的开发部署方案。大模型的核心作用是突破数据标注的困境,通过学习海量无标注的数据来做预训练,拓展整体模型前期学习的广度和深度,以此提升大模型的知识水平,从而低成本、高适应性地赋能大模型在后续下游任务中的应用。在实践中,预训练大模型在基于海量数据的自监督学习阶段完成了“通识”教育,再借助“预训练+精调”等模式,在共享参数的情况下,根据具体应用场景的特性,用少量数据进行相应微调,即可高水平完成任务。前言— 02 —从技术的角度来看,大模型发端于自然语言处理领域,以谷歌的BERT、OpenAI的GPT和百度文心大模型为代表,参数规模逐步提升至千亿、万亿,同时用于训练的数据量级也显著提升,带来了模型能力的提高。此外,继语言模态之后,如视觉大模型等其他模态的大模型研究,也开始逐步受到重视。进一步地,单模态的大模型被统一整合起来,模拟人脑多模态感知的大模型出现,推动了AI从感知到认知的发展。1.2 国家政策推动中国大模型加速发展AI软件及应用市场快速增长,AI大规模落地成主要关注点2021年中国人工智能软件及应用市场规模为51亿美元,预计2026年将会达到211亿美元,各行业的需求正大力推进AI的发展,将推动市场的持续增长。图1 训练大模型“预训练+精调”模式来源:IDC&百度产业应用精调应用自监督学习精调原子能力智能检索智能客服工业质检智能推荐智能审核智能录入......智能对话智能问答目标检测智能创作文档理解图像分割......任务相关少量数据海量无标注数据类似人类学习机制文本知识图像视频......专业教育预训练通识教育— 03 —随着数字经济、元宇宙等概念的逐渐兴起,人工智能进入大规模落地应用的关键时期,但其开发门槛高、应用场景复杂多样、对场景标注数据依赖等问题开始显露,阻碍了规模化落地。AI大模型凭借其优越的泛化性、通用性、迁移性,为人工智能大规模落地带来新的希望。国家政策对AI产业应用的关注与引导将推动预训练大模型加速发展在国家层面,各国都在强调人工智能在发展中的重要性,并相继出台相关政策,希望在新一轮产业变革中占据上风。中国在“十四五”期间,针对人工智能的未来发展陆续出台了相关指导方案和激励支撑政策,对人工智能的整体发展方向和技术发展重点做出重要规划,同时提出加强算法创新与应用、推动算力基础设施建设、完善数据基础支撑体系等关键建议,倡导未来不断夯实产业发展新基础。具体来看,上海市发布《上海市人工智能产业发展“十四五”规划》,《规划》中提到“十三五”时期上海人工智能发展面临的瓶颈:规模化应用深度不足,人工智能的应用以单个场景使用为主,深入传统行业核心业务流程、完整解决行业痛点、实现商业价值的应用较少;而大模型凭借其特性,直击痛点,将会图2 中国人工智能软件及应用市场规模预测,2021-2026来源:IDC AI Cloud tracker2021 2022 2023 2024 2025 202625000.020000.015000.010000.05000.00.05082.66467.89160.412840.616801.121077.0单位:百万美元— 04 —是未来突破发展瓶颈的关键技术。在基础理论研究中,《规划》还提到,“十四五”人工智能发展的主要任务是深化人工智能通用技术突破,面向自然语言处理、计算机视觉、语音识别等通用技术,支持相关科研机构和企业加快研发;建设先进算法模型,相关测试性能达到国际领先水平;支持对各类算法模型进行深度优化,适配实际应用需求。此外,北京市发布《北京市“十四五”时期高精尖产业发展规划》,《规划》重点关注:全面突

立即下载
信息科技
2023-04-26
39页
6.93M
收藏
分享

2022中国大模型发展白皮书,点击即可下载。报告格式为PDF,大小6.93M,页数39页,欢迎下载。

本报告共39页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共39页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
2021-2027年激光雷达市场规模预测
信息科技
2023-04-26
来源:光器件行业深度报告:激光上游赋能千行百业,算力时代网络底座基石
查看原文
2021年激光雷达下游应用结构
信息科技
2023-04-26
来源:光器件行业深度报告:激光上游赋能千行百业,算力时代网络底座基石
查看原文
3D成像和传感模组及元器件示例
信息科技
2023-04-26
来源:光器件行业深度报告:激光上游赋能千行百业,算力时代网络底座基石
查看原文
2019-2025年全球3D成像和传感市场规模预测
信息科技
2023-04-26
来源:光器件行业深度报告:激光上游赋能千行百业,算力时代网络底座基石
查看原文
3D成像和传感在全球手机厂商中的应用
信息科技
2023-04-26
来源:光器件行业深度报告:激光上游赋能千行百业,算力时代网络底座基石
查看原文
3D视觉感知主要技术性能对比
信息科技
2023-04-26
来源:光器件行业深度报告:激光上游赋能千行百业,算力时代网络底座基石
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起