计算机行业周报:多模态GPT,比我们想象的更近

请仔细阅读本报告末页声明 证券研究报告|行业周报 2023 年 03 月 05 日 计算机 多模态 GPT,比我们想象的更近 微软推出多模态大语言模型 KOSMOS-1,印证大语言模型能力可延伸至 NLP外领域。该模型采用多模态数据训练,可感知图片、文字等不同模态输入,并学习上下文,根据给出的指令生成回答的能力。经过测试比较,KOSMOS 在语言理解、语言生成、无 OCR 文本分类、常识推理、IQ 测试、图像描述、零样本图像分类等任务上都取得了相比之前其他单模态模型更好的效果。 产业竞争已经开启,预计 GPT4/4.5 或将推动多模态。据《财富》杂志报道,GPT4有望于今年发布。根据 OpenAI 的 CEO Sam Altman 的公开采访推测,相较前代,GPT4 可能不会有参数量上的巨幅提升,而是在其他方向寻求提高。我们认为,多模态模型训练数据为图像、视频等,规模远大于语言类模型,算力需求有望激增,也会同样为 AI 视觉、视频传输等领域的公司带来全新需求突破。 GPT 带来通用智能,多模态使得输入输出信号超越语言,且国内具备快速追赶及超越机会。1)GPT 代表通用智能,ChatGPT 基于其思维链(CoT)能力已经能在多种任务、各类领域里产生应用,且当前已经开放 API,参考过往 GPT3 可进行细分领域 fine-tune 的实例,未来有望向更通用领域发展。2)多模态是未来实现通用人工智能的关键。现实世界中的数据天然就是多模态的,人类通过综合运用多种感官,来感知和理解现实世界中的数据,而多模态使得 AI 的输入输出信号超越语言。3)从 KOSMOS1 论文看,主要作者为华裔,KOSMOS 模型规模不大,且披露了较多训练细节,有利于复现;国内具备海量视频数据优势,可能具备快速追赶、甚至超越的机会。 多模态未来能力提升空间巨大,带来千行百业应用。我们认为,多模态 GPT 落地应用速度将会很快,国内有望复现类似模型并快速在细分场景使用。1)1~5 年内,多模态的输入输出主要将是文本、图像和音频,一大应用场景会是智能办公,如智能 PPT 和其他 office 套件,可以通过理解用户语言需求和根据用户提供的多模态输入数据,产出办公成果。2)1~7 年内,多模态有望在综合机器视觉领域得到广泛应用,输入输出将包括 3D 模型,视频等,有望赋能自动驾驶领域感知、规控和仿真能力,亦有望有望提高 3D 模型生产效率,助力游戏内容与元宇宙构造。3)5~10 年内,多模态 AI 模型有望具备与真实世界所有输入交互的能力,将极大提升人形机器人的能力,使得人形机器人加速落地普及。 投资建议。建议关注:1)视觉智能:海康威视、大华股份、云从科技、商汤科技。2)产业工具:当虹科技、数码视讯、网达软件等;3)潜在多模态受益:万兴科技、中科创达、新国都等。 风险提示:AI 技术迭代不及预期风险;经济下行超预期风险;行业竞争加剧风险。 增持(维持) 行业走势 作者 分析师 刘高畅 执业证书编号:S0680518090001 邮箱:liugaochang@gszq.com 相关研究 1、《计算机:GPT4 展望:多模态,CHATGPT 下一站》2023-02-28 2、《计算机:数字中国规划重磅落地,重视三大数字经济方向》2023-02-27 3、《计算机:ChatGPT 技术篇:智能背后的秘密》2023-02-26 -32%-16%0%16%2022-032022-072022-112023-03计算机沪深300仅供内部参考,请勿外传2023 年 03 月 05 日 P.2请仔细阅读本报告末页声明 内容目录 1、微软推出 KOSMOS-1 多模态大语言模型 .............................................................................................................. 3 2、产业竞争已经开启,预计 GPT4 或 GPT4.5 将推出多模态 ..................................................................................... 5 3、多模态通向通用智能,有望提升机器视觉规模效应 .............................................................................................. 8 4、多模态应用展望:广阔蓝海 .............................................................................................................................. 10 5、投资建议 ......................................................................................................................................................... 12 6、风险提示 ......................................................................................................................................................... 12 图表目录 图表 1:KOSMOS-1 可以接受多模态输入,学习上下文信息,进行推理和回答 ............................................................ 3 图表 2:KOSMOS-1 的多种能力展示,包括(1-2)视觉解释(3-4)视觉问答,(5)网页问题解答(6)简单数学方程(7-8)数字识别 .......................................................................................................................................................... 4 图表 3:在许多任务中 KOSMOS-1 都能取得较好效果 ............................................................................................... 4 图表 4:OpenAI 掌舵人称推特上被疯转的此图“完全是胡说” ................................................................................. 6 图表 5:用 DALL-E2 生成宇航员骑马图 ......

立即下载
电子设备
2023-03-06
国盛证券
13页
1.62M
收藏
分享

[国盛证券]:计算机行业周报:多模态GPT,比我们想象的更近,点击即可下载。报告格式为PDF,大小1.62M,页数13页,欢迎下载。

本报告共13页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共13页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
2022 年碳纤维周度产量及开工率数据 图表 38:2022 年碳纤维周度库存量及增速数据
电子设备
2023-03-06
来源:建筑材料行业周报:玻璃出货率好转,长鞭效应酝酿价格弹性,建议左侧配置
查看原文
玻纤库存情况(单位:吨) 图表 22:玻纤月产能情况(吨)
电子设备
2023-03-06
来源:建筑材料行业周报:玻璃出货率好转,长鞭效应酝酿价格弹性,建议左侧配置
查看原文
2022 年、2023 年复产及新点火生产线
电子设备
2023-03-06
来源:建筑材料行业周报:玻璃出货率好转,长鞭效应酝酿价格弹性,建议左侧配置
查看原文
全国水泥价格 图表 5:全国水泥库存
电子设备
2023-03-06
来源:建筑材料行业周报:玻璃出货率好转,长鞭效应酝酿价格弹性,建议左侧配置
查看原文
本周国盛建材行业个股涨跌幅榜后五
电子设备
2023-03-06
来源:建筑材料行业周报:玻璃出货率好转,长鞭效应酝酿价格弹性,建议左侧配置
查看原文
本周国盛建材行业个股涨跌幅榜前五
电子设备
2023-03-06
来源:建筑材料行业周报:玻璃出货率好转,长鞭效应酝酿价格弹性,建议左侧配置
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起