计算机行业动态研究:GPT-4o、Gemini新品接连发布,多模态技术奇点加速到来

国海证券研究所请务必阅读正文后免责条款部分2024 年 05 月 16 日行业研究评级:推荐(维持)研究所:证券分析师:刘熹S0350523040001liux10@ghzq.com.cn[Table_Title]GPT-4o、Gemini 新品接连发布,多模态技术奇点加速到来——计算机行业动态研究最近一年走势行业相对表现2024/05/16表现1M3M12M计算机5.1%6.2%-25.0%沪深 3003.7%8.2%-8.5%相关报告《计算机事件点评:运营商 AI 服务器订单超预期,国产化不断提速(推荐)*计算机*刘熹》——2024-04-22《计算机行业动态研究:阶跃星辰发布 Step-2 万亿参数模型,AI 应用+算力景气上行(推荐)*计算机*刘熹》——2024-03-26《AI 算力月度跟踪(202403):NVIDIA B200 再创算力奇迹,液冷、光模块持续革新(推荐)*计算机*刘熹》——2024-03-24《计算机行业事件点评:NVIDIA H20 或将与国产算 力 同 步 高 增 ( 推 荐 ) * 计 算 机* 刘 熹 》 — —2024-03-03《计算机行业月报:英伟达业绩再超预期,国产算力 需 求 再 扩 大 ( 推 荐 ) * 计 算 机* 刘 熹 》 — —2024-02-28事件:2024 年 5 月 14 日,OpenAI 在官网正式发布新旗舰模型 GPT-4o 多模态大模型,其中 o 代表的是 omni,即“全能”,GPT-4o 可以实时对音频、视觉和文本进行推理,相较于 GPT-4 Trubo 速度更快、价格更便宜。2024 年 5 月 15 日,2024 年谷歌 I/O 大会正式召开,会上谷歌将搜索业务做了最彻底的 AI 改造,更新升级了 Gemini1.5Pro 版本,推出Gemini1.5Flash 轻量化小模型、生成视频模型 Veo、AI 智能体 ProjectAstra,并展示了与 GPT-4o 相似的语音视觉交互功能 Gemini Live。投资要点:GPT 持续迭代,GPT-4o 推动人机交互再上新台阶OpenAI 持续升级 GPT 版本,2023 年 3 月发布 GPT-4 在图片识别、图文数据综合处理及逻辑推理等能力实现质变;2023 年 11 月发布GPT-4Turbo,支持 125 万 tokens 的同时也在上下文等多个领域实现显著进步。本次发布 GPT-4o 带来各种能力升级:①多模态交互,具有更优质的视频和音频理解以及图像生成能力:GPT-4o 能够接受文本、音频和视频的任意组合作为输入,并生成文本、音频和图像的任意组合作为输出。与现有模型相比,GPT-4o 在视觉和音频理解方面有更好的表现;在理解和生成图像方面的能力优于现有模型,能完成过往模型无法完成的任务。②情绪感知:GPT-4o 能够结合视频和音频感受对话者的情绪,并给出充满人类情感的反馈。例如:在根据工作人员要求讲故事时,工作人员可以随时插话打断并提出新要求,GPT-4o 能几乎毫无停顿地接上话题并按照要求变化音色、语调、情感等。③毫秒级响应:GPT-4o 对音频输入的响应时间可以快到 232 毫秒,平均为 320 毫秒,这与人类在对话中的响应时间相近,此前 GPT-4 的语音响应约 5.4 秒。④性能&成本优势:在传统基准测试中,GPT-4o 在文本、推理和编码智能方面,达到了 GPT-4 Turbo 级别的性能,同时在多语言、音频和视觉能力方面创下了新高。相比 GPT-4 Turbo,GPT-4o 推理速度提升 2倍的同时,价格降低 50%。证券研究报告请务必阅读正文后免责条款部分2打造全新 GPT 语音助手且免费开放,合作苹果&微软加速端侧落地OpenAI 通过 GPT-4o 打造的语音版 ChatGPT 助手,当前已在ChatGPT 中开放使用,同时模型 API 同步放出。GPT 语音助手主要功能包括与用户跨音频、视频进行交流,例如,让 GPT-4o 进行实时翻译、唱歌、做数学题、讲笑话等。未来,OpenAI 将会在 ChatGPT Plus 中推出新版语音模式 GPT-4o 的 alpha 版。OpenAI 与苹果合作,加速 ChatGPT 在端侧落地。OpenAI 宣布推出一款适用于 macOS 的桌面级应用,使用键盘快捷键就可向 ChatGPT提问。用户可通过电脑与 ChatGPT 语音对话,GPT-4o 的新音频和视频功能后续将推出。据《每日经济新闻》援引彭博社 5 月 10 日报道,苹果被曝正与 OpenAI 敲定一项协议,今年将后者的部分技术引入 iPhone。借此苹果将能提供由 ChatGPT 支持的“聊天机器人”,作为 iOS 18 中人工智能功能的一部分。谷歌发布 Project Astra、Veo 等,多模态技术奇点加速到来2024 年 5 月 15 日凌晨,Google I/O 开发者大会上发布了通用 AI 智能体 Project Astra,可实现跨文本、音频、视频多模态实时推理。同时,谷歌正式发布一款全新的视频生成模型 Veo,谷歌声称,Veo 能够根据文本、图像创建超过 60 秒的高质量 1080P 视频,用户可以对光照、镜头语言、视频颜色风格等进行设定。我们认为,OpenAI、谷歌等新品的推出,体现出多模态大模型技术的持续升级,GPT-4o 的发布将革新人机交互模式,推动大模型在终端加速推广。随着多模态技术奇点加速到来,未来基于大模型的创新应用将更值得期待,大模型技术将全面赋能教育、办公等行业和场景。行业评级及投资策略:GPT-4o、Gemini 新品陆续发布,多模态大模型技术奇点加速到来,大模型的商业价值、AI 应用的创新突破以及 AI 算力需求的持续增长可期,维持对计算机行业“推荐”评级。相关个股:(1)大模型:科大讯飞、三六零、拓尔思、云从科技;(2)AI 应用:金山办公、万兴科技、福昕软件、焦点科技、虹软科技、彩讯股份、佳发教育、鸥玛软件、拓维信息;(3)AI 终端:华勤技术、软通动力、海康威视、大华股份、芯海科技、联想集团、飞荣达;(4)AI 算力:浪潮信息、工业富联、中科曙光、神州数码、紫光股份、中际旭创、沪电股份、新易盛、海光信息、寒武纪等。风险提示:宏观经济影响下游需求、大模型发展不及预期、市场竞争加剧、中美博弈加剧、相关公司业绩不及预期等。证券研究报告请务必阅读正文后免责条款部分3重点关注公司及盈利预测重点公司股票2024/5/15EPSPE投资代码名称股价(元)20232024E2025E20232024E2025E评级002230.SZ 科大讯飞42.840.280.360.57150.90119.5174.86买入601360.SH三六零8.51-0.070.010.03-123.471,293.77266.70未评级300229.SZ拓尔思16.630.050.300.41362.6954.8240.23未评级688111.SH金山办公279.502.853.654.9297.9576.6056.86买入300624.SZ 万兴科技83.350.630.770.95133.14107.27

立即下载
电子设备
2024-05-16
国海证券
刘熹
19页
1.52M
收藏
分享

[国海证券]:计算机行业动态研究:GPT-4o、Gemini新品接连发布,多模态技术奇点加速到来,点击即可下载。报告格式为PDF,大小1.52M,页数19页,欢迎下载。

本报告共19页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共19页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
图表 5 2019-2024Q1 毛利率及净利率(%) 图表 6 2019-2024Q1 各项费用率(%)
电子设备
2024-05-16
来源:负极出货稳定增长,加快创新产品迭代
查看原文
图表 1 2019-2024Q1 营业收入及同比增速(亿元) 图表 2 2019-2024Q1 归母净利润及同比增速(亿元)
电子设备
2024-05-16
来源:负极出货稳定增长,加快创新产品迭代
查看原文
图表 25. 中国台湾地区上市上柜 CCL 企业月度营收情况(2021.01-2024.03)
电子设备
2024-05-16
来源:PCB行业跟踪:下游复苏带动景气回温,成本驱动覆铜板先行
查看原文
图表 23. 中国台湾地区上市上柜 PCB 企业月度营收情况(2021.01-2024.03) 图表 24. 中国台湾地区上市上柜 PCB 设备企业月度营收情况(2021.01-2024.03)
电子设备
2024-05-16
来源:PCB行业跟踪:下游复苏带动景气回温,成本驱动覆铜板先行
查看原文
图表 21. 中国台湾地区上市上柜玻纤布企业月度营收情况(2021.01-2024.03) 图表 22. 中国巨石、华源新材料涨价通知
电子设备
2024-05-16
来源:PCB行业跟踪:下游复苏带动景气回温,成本驱动覆铜板先行
查看原文
图表 19. 国内 CCL 大厂涨价通知
电子设备
2024-05-16
来源:PCB行业跟踪:下游复苏带动景气回温,成本驱动覆铜板先行
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起