人工智能行业从算力、算法、数据和应用看AIGC:奇点将至,探他山之石

仅供机构投资者使用行业研究报告奇点将至,探他山之石——从算力、算法、数据和应用看AIGC请仔细阅读在本报告尾部的重要法律声明华西海外团队2023年3月19日朱芸执业证书编号:S1120522040001联系人:李佳妮/侯钧皓/吴嘉悦目录101 核心观点03 数据:大模型训练的基础资源02 生成式AI:ChatGPT引燃市场,数字经济未来已至05 算法:大模型算法助力AIGC突破04 算力:大模型发展带来高算力需求07 生成式AI海外受益标的08 风险提示06 产业应用:各领域应用加速落地,商业化前景广阔gZeVeWsUrMqNsPbRcM6MmOoOpNnOfQmMtQjMnPnN6MqRsOMYmQrQxNrNoP•AIGC未来已来,超预期持续出现从2018到2023年,四代GPT模型高速进步,从简单的问答、阅读理解、文本总结,到在众多测试中获得“人类级别表现”评级,AI迭代进化的速度越来越快。可以预期,AI达到人类智能水平、乃至超越人类智能水平的时代会以超预期的形态和速度出现。•数据、算力、算法为AIGC核心要素,海内外厂商各占鳌头数据,通过算力,最后产生了算法或者应用。数据作为新兴生产要素,数据的拥有者、加工者是产业发展的基础。算力作为基础设施,是AIGC资本开支的主要受益者,核心参与者英伟达、AMD竞争优势显著。AIGC的技术壁垒主要体现在算法上,当前通用型AI由GPT领跑,而在细分领域上,行业内的主要参与者包括谷歌、Meta、Anthropic、Hugging Face和百度等公司。随着细分龙头竞相研发创新算法和优化现有技术、以及模型迭代下对数据、算力的需求高速膨胀,AIGC行业技术壁垒将不断提高,现有优秀参与者护城河极深。•AIGC市场潜力巨大,应用领域迎来生产力解放根据Tractica的预测数据显示,全球AI软件市场规模将在2025年达到1260亿美元,2021年到2025年年复合增长率为41.02%。一级市场的火热也反映了AIGC发展的确定性趋势。在大模型的快速迭代推动下,搜索引擎、办公软件、汽车、媒体、AI绘画设计、AI广告营销、智能工作助理等应用率先落地的行业将具备较强商业化机会。报告亮点:作为海外团队,我们期待该篇报告能够尽可能呈现海外市场当前在生成式AI (AIGC)领域的布局和进展,从算力、算法、数据和应用入手,看清趋势,寻找差异。一是尽可能减少我们对海外认知的信息差,更重要的是,他山之石,可以攻玉,海外映射是国内可以持续关注的重点。核心观点核心要点:风险提示:•技术落地商业化不及预期•人工智能在部分领域应用的监管风险•外部环境导致芯片、软件等供应限制投资建议:我们认为生成式AI模型不断加速迭代,将快速推动生成式AI技术的商业化推广应用的进程,带动产业三大要素—数据、算力、算法和应用的高速发展。后续建议密切关注生成式AI产业链上四条投资主线:(1)数据是大模型训练的基础资源,随着大模型项目迭代发展,对训练用数据集需求将不断上升,受益标的为数据提供商龙头Appen(APX.AX);(2)大模型发展带来高算力需求,人工智能芯片市场巨大,受益标的为英伟达(NVDA.O)、AMD(AMD.O);(3)各大厂商布局大模型算法项目,龙头科技企业具有技术优势,受益标的为微软(MSFT.O)、谷歌(GOOG.O)、Meta(META.O)、百度(BIDU.O/9888.HK);(4)生成式AI商业化应用落地领先领域,受益标的为自动驾驶技术公司Mobileye(MBLY.O)、数字媒体Buzzfeed(BZFD.O)、办公软件微软(MSFT.O)。核心观点目录401 核心观点03 数据:大模型训练的基础资源02 生成式AI:ChatGPT引燃市场,数字经济未来已至05 算法:大模型算法助力AIGC突破04 算力:大模型发展带来高算力需求07 生成式AI海外受益标的08 风险提示06 产业应用:各领域应用加速落地,商业化前景广阔AIGC(AI Generated Content)即生成式AI,多领域应用逐渐成熟。AIGC涉及无监督和半监督学习算法,截至目前其发展历程主要分为三个阶段:•统计机器学习方法阶段(2010年前):首先对数据进行手工标注,然后构建其重要特征,最后构建概率模型并进行参数优化,从而将概率最大的输出作为结果;•基于深度学习的神经网络模型(2010年-2017年):深度学习算法被引入,本质上是通过大量数据训练神经网络,主要表现形式为:CNN(卷积神经网络)、RNN(循环神经网络)等。相比统计学习方法,省去了复杂且手工的特征构建;•基于Transformer结构的预训练模型(2017年至今):利用大量无标注数据进行自监督学习,然后再使用少量的标注数据对下游任务进行微调(即迁移学习)。•在应用方面,按场景分类AIGC已经较为成熟地应用于文本和代码撰写、图像识别和生成,以GPT为首的AIGC模型也正在探索消费级AI技术的变现方式。展望未来,AIGC不仅会在现有应用领域持续进步,也将逐步拓展到视频和游戏领域,AIGC将会在更多的领域得到广泛应用,为各个行业和领域的发展和进步提供更多可能性。表1:AI应用发展进程预测2020前20202022预计2025预计2030预计2050文本垃圾邮件检测翻译基础问答基础文案撰写生成草案撰写更长文章完善文稿对科学论文等进行垂直微调文章终稿超过人类平均水平文章终稿超过专业作者水平代码单行自动完成多行代码生产更长代码更高准确度更多语言深度提高文本到产品(草稿)文本到产品(终稿),超过大部分开发者图像艺术Logo摄影产品设计、建筑等模型产品设计、建筑等终稿终稿超过大部分专业艺术家、设计师、摄影师水平视频/3D/游戏视频和3D制作的初稿完善版本AI创作平台游戏和电影实现个性化定制开始尝试基本完成黄金时期 生成式AI:自然语言处理演变十余年,迎来变现阶段OpenAI创立于2015年12月,发布ChatGPT引燃AI行业热度。GPT系列是OpenAI打造的自然语言处理模型,采用以Transformer结构为核心的模型,其最大特点是使用了大量的未标注的语料进行无监督的预训练,然后在各种有监督的任务上进行微调。OpenAI于2022年11月先后推出了GPT-3.5和ChatGPT,GPT-3.5使用了更新的语料进行预训练,而ChatGPT是基于GPT-3.5的对话机器人,能够根据用户的输入生成流畅、有逻辑的回答,以及完成撰写论文报告、翻译文字、编写代码等文本生成任务,并且能根据聊天的上下文进行互动。ChatGPT发布后爆火,仅用5天时间用户量便破百万,推出2个月后用户量破亿,成为史上用户增长速度最快的消费级应用程序。3月14日,OpenAI进一步推出GPT-4.0,相比当前ChatGPT使用的GPT-3.5,增加了输入图像的功能;扩写能力增强,能处理超过25000个单词的文本;更具创造力,并且能够处理更细微的指令。GPT模型迭代的参数量及训练量均呈指数级增长,使得AI从实验技术成长为稳定生产力。图1:ChatGPT仅发布5天便达到百万用户资料来源:Statista,TRTWorld, 华西证券研究所020040060080

立即下载
信息科技
2023-03-28
华西证券
48页
4.11M
收藏
分享

[华西证券]:人工智能行业从算力、算法、数据和应用看AIGC:奇点将至,探他山之石,点击即可下载。报告格式为PDF,大小4.11M,页数48页,欢迎下载。

本报告共48页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共48页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
图 18 New Bing 发布次日 Bing 下载量猛增 758% 图 19 百度知识图谱的首要应用场景即为搜索
信息科技
2023-03-28
来源:传媒行业AGI(通用人工智能)专题之二:“文心一言”发布,国内厂商距离复现ChatGPT有多远?
查看原文
图 9 全球前十大科技企业数据中心容量排名 图 10 百度昆仑一、二代芯片与英伟达 A100 参数对比
信息科技
2023-03-28
来源:传媒行业AGI(通用人工智能)专题之二:“文心一言”发布,国内厂商距离复现ChatGPT有多远?
查看原文
图 7 主流大模型数据集来源可分为六类 图 8 各类数据来源大小
信息科技
2023-03-28
来源:传媒行业AGI(通用人工智能)专题之二:“文心一言”发布,国内厂商距离复现ChatGPT有多远?
查看原文
表 1 Github 社区中主流 AI 框架情况(2022.1)
信息科技
2023-03-28
来源:传媒行业AGI(通用人工智能)专题之二:“文心一言”发布,国内厂商距离复现ChatGPT有多远?
查看原文
图 3 2005 年起中国 AI 论文总数超美国 图 4 海外 AI 机构预测中国高引论文占比将超过美国
信息科技
2023-03-28
来源:传媒行业AGI(通用人工智能)专题之二:“文心一言”发布,国内厂商距离复现ChatGPT有多远?
查看原文
分众电梯 LCD 的 TOP10 品牌主投放情况及环比变化(单位:秒)
信息科技
2023-03-28
来源:传媒行业:GPT_4、文心一言相继发布,AI应用布局正当时
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起