AI行业跟踪报告之三:百度文心一言发布在即,把握AI软硬件投资机会
证券研究报告 2023年3月15日 作者: 百度文心一言发布在即,把握AI软硬件投资机会 ——AI行业跟踪报告之三 光大证券电子通信行业首席分析师 刘凯 ,执业证书编号:S0930517100002 光大证券计算机行业首席分析师 吴春旸,执业证书编号:S0930521080002 请务必参阅正文之后的重要声明 核心观点 GPT4引领认知革命,国内百度文心一言发布在即;文心大模型场景全面,开启我国AI追赶序幕,建议从三大层面关注AI软硬件投资机会: 1、AI公司:大模型为AI应用最核心中枢,人工智能公司正打开想象天花板,建议关注三六零(A股唯一自研大模型公司)。 2、上游算力:训练模型带动算力需求,AI算力芯片为关键,建议关注寒武纪(A股AI算力芯片龙头)。 3、下游应用:建议关注百度生态合作伙伴及下游垂类应用企业。 风险提示:市场竞争加剧,研发不及预期。 2 请务必参阅正文之后的重要声明 目 录 1、大模型打开想象空间, MaaS模式应运而生 3、云端算力硬件将成为AI新浪潮的关键基础设施 4、投资建议:从三大层面关注AI软硬件投资机会 5、风险分析 2、百度文心大模型场景全面,开启我国AI追赶序幕 请务必参阅正文之后的重要声明 4 1.1、溯源ChatGPT,“大模型”作为基础设施为AI发展带来新机遇 图1:ChatGPT是一个人工智能对话模型,可以生成代码、故事、诗歌等 资料来源:ChatGPT官网,光大证券研究所 考试内容 成绩 Upenn 沃顿商学院MBA期末考试 B- CPA 注册会计师 57.6% Bar 法律 50.3% SAT 美国大学入学测试 1020分(超过48%人类考生)Google 职业能力考试 三级工程师(年薪18万美元)IQTest.com 智商测试 83分(低于平均) Vocabulary 词汇测试 151分(平均99分) 1)性能:ChatGPT 在一系列对话式 AI 任务上优于最先进的模型,包括问答、文本生成和对话生成。在基准测试中,ChatGPT 在许多对话式 AI 任务上都达到了人类水平的准确度。 3)模型大小:GPT-3是世界上最大的语言模型之一,拥有1750亿个参数。 2)训练数据:ChatGPT 在来自互联网的超过 45 TB 文本数据的语料库上进行训练。这个庞大的数据集用于教授模型自然语言中的模式和关系,并建立对单词和短语的上下文和含义的丰富理解。 表1:ChatGPT部分职业测试成绩 资料来源:LifeArchitect,光大证券研究所整理 图3:语言模型发展历程 资料来源:OpenAI 论文 OpenAI 2ChatGPT45TB 1、大模型打开想象空间, MaaS模式应运而生(1/2) 请务必参阅正文之后的重要声明 MaaS的商业模式应运而生。MaaS(Model as a Service),模型即服务,这种模式具体运作方式是,有能力的大公司提供预训练模型,使得垂直行业的小公司能够构建和部署 AI 模型,而无需投资构建和维护自己的模型所需的基础设施、硬件和专业知识。 图4:各垂类行业公司借助大模型API接口实现各种场景下的应用落地 资料来源:腾讯研究院,光大证券研究所 5 1、大模型打开想象空间, MaaS模式应运而生(2/2) 请务必参阅正文之后的重要声明 目 录 1、大模型打开想象空间, MaaS模式应运而生 3、云端算力硬件将成为AI新浪潮的关键基础设施 4、投资建议:从三大层面关注AI软硬件投资机会 5、风险分析 2、百度文心大模型场景全面,开启我国AI追赶序幕 请务必参阅正文之后的重要声明 7 2.1、百度生态体系完善,在四层技术架构均具备领先的技术能力。百度以自主研发的云端通用AI芯片作为AI架构的芯片层,基于产业级深度学习开源开放平台飞桨平台,形成几大模型体系,配套大模型平台支持模型的广泛应用,建设了大模型为核心驱动的新产品和创业社区,并将AI技术赋能如搜索引擎、百度智能云等现有产品。 资料来源:百度,光大证券研究所 2、百度文心大模型场景全面,开启我国AI追赶序幕(1/4) 框架层芯片层模型层NLP大模型 CV大模型 跨模态大模型 生物计算大模型 行业大模型应用层搜索 AIGC 媒体 金融 教育 医疗 …图5:百度AI核心四层架构布局 请务必参阅正文之后的重要声明 8 2.2、文心大模型全景图刷新,构建产业大模型体系。大模型的出现,为人工智能进一步发展带来新机遇,深度学习平台加大模型,贯通AI全产业链,夯实产业智能化基座,将进一步加速智能化升级。 资料来源:文心大模型官网,光大证券研究所 图6:百度文心全景图 2、百度文心大模型场景全面,开启我国AI追赶序幕(2/4) 请务必参阅正文之后的重要声明 9 2.3、文心NLP大模型性能强大、功能丰富,为垂类应用落地提供强大支持。 其中,文心一言(生成式AI产品)是基于产业级知识增强预训练大模型ERNIE 3.0,结合了知识图谱、视觉信息、多语言等多种数据源,实现了对话式语言模型的全面升级。 资料来源:文心大模型官网,光大证券研究所 表2:百度文心NLP模型 文心·NLP大模型 参数量级 效果 应用场景 ERNIE 3.0 Tiny 轻量级 20 个中英文数据集上取得效果 SOTA 适用于电商、科学、新闻、医学、对话等领域,包含评论情感分析、科学文献学科分类、新闻分类、自然语言推理等任务。 ERNIE 3.0 百亿级 在 14 种类型共计 45 个自然语言理解数据集上取得 了 SOTA 的结果 在 9 个自然语言生成任务上取得了 SOTA 的效果 在 18 个数据集上刷新了 zero-shot 的 SOTA 效果 智能创作、摘要生成、问答、语义检索、情感分析、信息抽取、文本匹配、文本纠错等各类自然语言理解和生成任务 鹏城-百度·文心 2600 亿 在机器阅读理解、文本分类、语义相似度计算等60多项任务中取得最好效果 舆情分析、智能创作、文本解析等 ERNIE 3.0 Zeus 千亿级 ERNIE 3.0 系列模型的最新升级,实现了任务知识增强,显著提升了模型的零样本/小样本学习能力 智能创作、摘要生成、问答、语义检索、情感分析、信息抽取、文本匹配、文本纠错等各类自然语言理解和生成任务 2、百度文心大模型场景全面,开启我国AI追赶序幕(3/4) 请务必参阅正文之后的重要声明 10 2.4、跨模态大模型、行业大模型等带来更多AIGC应用突破,B端生态圈持续扩大。B端开放接口双向输入,从行业接入数据源做训练,输出行业垂直技术解决方案,形成良性循环。未来,将有越来越多的企业和开发者通过大模型加深度学习平台的模式,步入AI应用的新阶段,进一步加速产业智能化升级。 资料来源:光大证券研究所 C端 基础学科 人文 自然 历史 知识垂类 医疗健康 教育 金融 生活服务 B端 金融 通用:智能客服 定制:产品推荐 医疗 论文检索-理解归纳- 结果输出 教育 提供类MaaS的商业价值 媒体 定制版内容生成机器人 生态伙伴 巨人网络、汽车之家、 智联招聘、太平洋网络、 土巴兔、掌阅科技、 携程、爱奇艺、 利欧股份、华策影视、蓝色光标、神策数据、风语筑
AI行业跟踪报告之三:百度文心一言发布在即,把握AI软硬件投资机会,点击即可下载。报告格式为PDF,大小1.37M,页数25页,欢迎下载。



