计算机:多模态,AI大模型新一轮革命

行业研究行业专题报告证券研究报告计算机2024 年 02 月 18 日诚信专业发现价值1请务必阅读报告末页的声明计算机多模态,AI 大模型新一轮革命投资要点:多模态推动人工智能迈向 AGI,底层技术日臻成熟相比单模态,多模态大模型同时处理文本、图片、音频以及视频等多类信息,与现实世界融合度高,更符合人类接收、处理和表达信息的方式,与人类交互方式更加灵活,表现的更加智能,能够执行更大范围的任务,有望成为人类智能助手,推动 AI 迈向 AGI。就技术架构而言,多模态技术可拆解为编码、对齐、解码与微调等步骤,逐步挖掘多模态关联信息,输出目标结果。文生图 CLIP 模型为最先成熟的多模态技术,目前,多模态已不再局限于图文两层信息。例如,Meta-Transformer 可同时理解并处理 12 种模态信息。OpenAI 谷歌开启多模态军备竞赛,Sora 和 Gemini 各领风骚海外龙头具备先发与技术优势,引领多模态大模型前进方向:1)OpenAI 近期密集剧透 GPT-5,相比 GPT-4 实现全面升级,重点突破语音输入和输入、图像输出以及最终的视频输入方向,或将实现真正多模态;此外,2 月发布文生视频大模型 Sora,能够根据文本指令或静态图像生成 1 分钟的视频,其中包含精细复杂的场景、生动的角色表情以及复杂的镜头运动,同时也接受现有视频扩展或填补缺失的帧,能够很好地模拟和理解现实世界。2)Google 推出原生多模态大模型Gemini,可泛化并无缝地理解、操作和组合不同类别的信息;此外,2月推出 Gemini 1.5 Pro,使用 MoE 架构首破 100 万极限上下文纪录,可单次处理包括 1 小时的视频、11 小时的音频、超过 3 万行代码或超过 70 万个单词的代码库。3)Meta 坚持大模型开源,建设开源生态巩固优势,已陆续开源 ImageBind、AnyMAL 等多模态大模型。国内大模型厂商有望沿着复制海外先进技术与发挥生态禀赋优势的两大路径,与海外大厂逐步缩小差距。多模态提升大模型泛化能力,垂直领域应用场景广阔强调技术与业务的融合以推动业务的数字化转型和智能化升级,才能够最大化的发挥大模型价值同时激励大模型创新升级,实现业务效率提升与技术创新的良性循环。多模态大模型的应用场景和价值正在不断扩展和提升。从语音识别、图像生成、自然语言理解、视频分析,到机器翻译、知识图谱等,多模态大模型都能够提供更丰富、更智能、更人性化的服务和体验。在强大泛化能力基础上,大模型可以在不同模态和场景之间实现知识的迁移和共享,将大模型的应用扩展到不同的领域和场景。投资建议我们看好具有算法、数据等先发优势的国产大模型厂商,同时多模态提升大模型泛化能力,多元信息环境下实现“多专多能”,在垂直领域具有广阔的应用场景和市场价值。建议关注:1)AI+多模态:万兴科技、中科创达、虹软科技、当虹科技、大华股份、海康威视、漫步者、萤石网络、汉仪股份、美图公司、云从科技;2)AI+办公:金山办公、万兴科技、福昕软件、彩讯股份、金蝶国际、泛微网络、致远互联、鼎捷软件、汉得信息,用友网络;3)AI+教育/电商/医疗:科大讯飞、佳发教育、鸥玛软件、盛通股份、光云科技、值得买、焦点科技、小商品城、润达医疗、嘉和美康、创业慧康、迪安诊断等。风险提示技术发展不及预期、产品落地不及预期、AI 伦理风险等。强于大市(维持评级)一年内行业相对大盘走势团队成员分析师: 施晓俊(S0210522050003)SXJ3780@hfzq.com.cn联系人: 李杨玲(S0210123100071)lyl30339@hfzq.com.cn联系人: 王思(S0210123070006)ws30181@hfzq.com.cn相关报告1、计算机行业当前处于什么周期位置?——2024.02.052、AI 应用大幕徐徐展开——2024.01.283 、 计 算 机 板 块 央 国 企 控 股 公 司 梳 理 — —2024.01.25华福证券华福证券诚信专业发现价值2请务必阅读报告末页的声明行业专题报告 | 计算机正文目录1 多模态推动人工智能迈向 AGI...................................................................................41.1 多模态或成为 AI 大模型主流..................................................................................41.2 多模态发展路径逐步清晰,底层技术日臻成熟....................................................42 国内外大模型陆续更新,瞄准多模态方向升级.......................................................62.1 OpenAI 谷歌引战多模态,视频为重要角力点...................................................... 62.1.1 OpenAI 密集剧透 GPT-5,或将实现真正多模态...............................................62.1.2 OpenAI 推出首款视频生成模型 Sora,视频更加接近真实世界......................72.2 谷歌推出 Gemini,实现大模型多模态原生.........................................................112.2.1 Gemini 正式对外发布,多模态理解优势突出...................................................112.2.2 Gemini 1.5 突破 100 万 token,多模态能力实现飞跃......................................122.3 Meta 坚持模型开源,建设生态巩固优势............................................................. 152.4 国内加速对齐海外龙头,细分领域或有优势......................................................173 多模态提升大模型泛化能力,应用场景拓展性强.................................................203.1 通用多模态大模型积极开放,挖掘垂直场景广阔空间......................................213.2 AI+办公:重塑办公模式,解放员工生产力........................................................ 223.3 AI+教育:助力教育行业应材施教,促进教育师资均衡....................................

立即下载
电子设备
2024-02-19
华福证券
李杨玲,施晓俊,王思
28页
3.53M
收藏
分享

[华福证券]:计算机:多模态,AI大模型新一轮革命,点击即可下载。报告格式为PDF,大小3.53M,页数28页,欢迎下载。

本报告共28页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共28页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
图表 13 美股重点个股本周行情表现(2024-02-12 至 2024-02-16)
电子设备
2024-02-19
来源:全球科技行业周报:OpenAI发布首个AI视频模型Sora,影视、旅游及本地消费高景气
查看原文
图表 12 港股重点个股本周行情表现(2024-02-14 至 2024-02-16)
电子设备
2024-02-19
来源:全球科技行业周报:OpenAI发布首个AI视频模型Sora,影视、旅游及本地消费高景气
查看原文
图表 11A 股计算机重点个股涨跌幅前十(2024-02-05 至 2024-02-08)
电子设备
2024-02-19
来源:全球科技行业周报:OpenAI发布首个AI视频模型Sora,影视、旅游及本地消费高景气
查看原文
图表 10A 股传媒重点个股涨跌幅前十(2024-02-05 至 2024-02-08)
电子设备
2024-02-19
来源:全球科技行业周报:OpenAI发布首个AI视频模型Sora,影视、旅游及本地消费高景气
查看原文
图表 9 本周各行业涨跌幅统计
电子设备
2024-02-19
来源:全球科技行业周报:OpenAI发布首个AI视频模型Sora,影视、旅游及本地消费高景气
查看原文
图表 7 工业软件指数走势(980034.SZ) 图表 8 云计算指数走势(930851.CSI)
电子设备
2024-02-19
来源:全球科技行业周报:OpenAI发布首个AI视频模型Sora,影视、旅游及本地消费高景气
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起