AI行业跟踪报告第50期:OpenAI十二日发布会“收官”,AGI发展又一里程碑
敬请参阅最后一页特别声明 -1- 证券研究报告 2024 年 12 月 29 日 行业研究 OpenAI 十二日发布会“收官”,AGI 发展又一里程碑 ——AI 行业跟踪报告第 50 期 计算机行业 买入(维持) 作者 分析师:刘凯 执业证书编号:S0930517100002 021-52523849 kailiu@ebscn.com 分析师:颜燕妮 执业证书编号:S0930524030004 021-52523656 yanyanni@ebscn.com 分析师:白玥 执业证书编号:S0930524070017 021-52523683 baiyue@ebscn.com 行业与沪深 300 指数对比图 资料来源:Wind 一、OpenAI 十二日发布会正式落幕,开启智能化新纪元 北京时间 12 月 21 日,OpenAI 十二日发布会圆满结束。OpenAI 的这一系列创新不仅体现了其在 AI 领域的强大实力,也昭示着未来 AI 产业将迎来全新的浪潮,从视频生成到多模态 AI 的应用,这些技术的发展将为各个行业带来颠覆性的变化。具体而言,OpenAI 共依次发布了 o1 推理模型、ChatGPT Pro 订阅服务、强化微调技术、Sora、Canvas 功能的增强版本、ChatGPT 与苹果生态的集成、ChatGPT 的增强版高级语音模式、Projects in ChatGPT、ChatGPT 的升级版搜索功能、o1 正式版 API的全面上线、ChatGPT 的通话访问模式、ChatGPT 在 MacOS 上的更新以及最新的 o3 系列模型等。 图 1:12 Days of OpenAI 时间线 资料来源:digialps,光大证券研究所绘制 (注:在报告《OpenAI 十二日发布会开启,AI 产业再迎新浪潮——AI 行业跟踪报告第 45 期》中已对前四日发布会进行总结,该文将从第五日开始回顾 OpenAI 发布会内容。) Day 5:Apple Intelligence 深度整合 ChatGPT 此次 Apple Intelligence 集成 ChatGPT 后主要有三点升级:1)与 Siri 的协同。当Siri 判断某个任务可能需要 ChatGPT 的协助时,它可以将任务移交给 ChatGPT 处理;2)写作工具的增强,用户现在可以使用 ChatGPT 从头开始撰写文档,还能进行文档细化和总结;3)iPhone 16 的相机控制功能,它能够通过视觉智能让用户更深入地了解拍摄对象。 在实际演示环节,McDon 展示了如何在 iPhone 上启用这些功能。用户需要首先进入设置,启用 Apple intelligence 和 Siri,然后开启新的 ChatGPT 扩展。这场发布会最引人注目的环节,就是 ChatGPT 为苹果设备带来的视觉智能能力。OpenAI 团队用一场即兴的“圣诞毛衣大赛”来演示了这项技术。 当开发者长按 iPhone 的相机控制按钮,ChatGPT 就能实时分析画面中的内容。在演示中,系统不仅能识别出每个人身上毛衣的特征,还能以一种近乎幽默的方式为这些节日装扮打分排名。这项视觉集成的意义远不止于此。它实际上弥补了苹果 AI系统最致命的短板之一。在此之前,Siri 的视觉识别能力一直是其软肋,而现在通过与 ChatGPT 的合作,iPhone 用户可以随时通过相机获取周围物体的深度信息和解释。 要点 敬请参阅最后一页特别声明 -2- 证券研究报告 计算机行业 图 2:ChatGPT 对画面内容进行实时分析 资料来源:36 氪,光大证券研究所 Day 6:语音和视觉功能(Advanced Voice with Vision)发布 OpenAI 发布季第六天,5 月份预告的语音和视觉功能(Advanced Voice with Vision)终于发布。这意味着 ChatGPT 现在能够通过视觉和听觉与用户互动,提供实时的视觉互动体验,就像与真人视频聊天一样自在。 在今年 5 月 14 日的春季发布会上,OpenAI 首次正式介绍了 GPT-4o,其中最引人注目的莫过于其原生的多模态能力。实时视频通话功能的出现,将 AI 与人类的互动提升到了一个新的高度。用户不仅能够与 AI 进行实时对话,更令人惊喜的是,AI 可以理解用户的动作和环境。例如,当用户谈论桌子上的一杯红色冰美式咖啡时,AI 能够记住这个细节,并在稍后的问题中准确回答。 这种实时理解视觉的能力,对于 AI 来说无疑是一种前所未有的突破。OpenAI进行了场景演示,让 ChatGPT 与在场人员互动,甚至能精准地记忆名字和细节。OpenAI 还透露,这项新功能将在一周内对 Pro 和 Plus 用户开放。 图 3:ChatGPT 可以通过理解用户的动作及环境实时指导用户制作咖啡 资料来源:OpenAI 官方 X 账号 敬请参阅最后一页特别声明 -3- 证券研究报告 计算机行业 与实时视频通话相辅相成的另一个功能是实时理解屏幕。这个功能通过屏幕共享的方式,让 AI 能够查看用户的电脑屏幕,提供即时建议和反馈。这种实时辅助将大大提升工作效率,尤其在需要灵活处理复杂任务时,功能尤为显著。 此外,OpenAI 还十分应景地推出了“圣诞老人限定语音”,这是在高级语音模式中新增的一个音色,带有浓厚的节日气氛,用户可以在对话中体验到不同的语音输出,让人感受到节日的欢乐氛围。 图 4:ChatGPT 平台推出圣诞老人限定语音 资料来源:OpenAI 官方 X 账号,光大证券研究所 发布之日起,最新的移动应用将逐步向所有 Team 用户及大部分 Pro 和 Plus 订阅者推出高级语音视觉功能。对于欧洲的 Pro 和 Plus 用户,OpenAI 将尽快提供这项服务。至于企业用户和教育用户,他们将在明年年初获得访问权限。 Day 7:推出 Projects 功能,用户对话管理重大更新 OpenAI 在第七天的发布会上,发布推出一项革命性的功能——Projects。这一功能标志着对话管理方式的全新变革,为用户带来了前所未有的便捷体验。 Projects 功能允许用户在 ChatGPT 平台上创建和管理“Projects”,即对话项目。用户可以上传各类文件,包括文本、图片和视频等,同时设置个性化指令,以实现更高效的对话管理和项目协作。 敬请参阅最后一页特别声明 -4- 证券研究报告 计算机行业 图 5:Projects 功能上线 资料来源:ChatGPT、聚牛科技,光大证券研究所 Projects 功能的核心在于将聊天记录、文件及自定义指令整合至一个清晰的界面,提供给用户一个整洁的工作环境。用户只需在主页左侧导航栏上点击“+”号,便可以轻松创建一个新项目并为其命名。同时,用户还可以自定义 Projects的颜色,以个性化设置来提升使用体验。在创建 Projects 后,即使里面尚未添加任何文件,用户也可在该项目中直接开启全新的对话。 在功能体验上,Projects 允许用户使用 ChatGPT 的多项功能,如 SearchGPT、
[光大证券]:AI行业跟踪报告第50期:OpenAI十二日发布会“收官”,AGI发展又一里程碑,点击即可下载。报告格式为PDF,大小1.32M,页数12页,欢迎下载。
