计算机行业专题:火山引擎FORCE总结及API收入预期
请务必阅读正文之后的免责声明及其项下所有内容2024年12月20日火山引擎FORCE总结及API收入预期行业研究 · 行业专题 计算机 · 人工智能投资评级:优于大市(维持评级)证券分析师:熊莉021-61761067xiongli1@guosen.com.cnS0980519030002证券研究报告 | 请务必阅读正文之后的免责声明及其项下所有内容摘要Ø 豆包大模型更新发布,提升AI能力,推动多行业应用和开发者生态的发展。字节原动力大会上一系列产品发布更新:豆包视觉理解模型支持文本和图像输入,精准识别物体与场景,具备推理和复杂计算能力;豆包通用模型Pro较5月提升32%,全面对齐GPT-4o;火山引擎基于豆包大模型推出全域AI搜索,支持多模态理解,提升搜索效率;扣子1.5完善开发者生态,支持多种应用形态发布;火山引擎新服务提升AI体验,优化计算、存储和安全,数据飞轮2.0为大模型训练提供优质数据支持。Ø 风险提示:AI应用落地不及预期、市场需求不及预期、行业竞争加剧、宏观经济波动。请务必阅读正文之后的免责声明及其项下所有内容目录火山引擎FORCE总结及API收入预期01风险提示02请务必阅读正文之后的免责声明及其项下所有内容豆包大模型推进迅速,各场景迅速渗透• 模型使用量:截至12月中旬,豆包通用模型的日均tokens使用量已超过4万亿,较五月首次发布时日均1200亿增长了33倍,大模型应用正在向各行各业加速渗透。• 智能终端合作情况:豆包大模型已经与八成主流汽车品牌合作,并接入到多家手机、PC等智能终端,覆盖终端设备约3亿台,来自智能终端的豆包大模型调用量在半年时间内增长100倍。• 多场景快速渗透:最近3个月,豆包大模型在信息处理场景的调用量增长了39倍,帮助企业更好的分析和处理内部及外部的数据;客服与销售场景增长16倍,帮助企业更好的服务客户,扩大销售;硬件终端场景增长13倍,AI工具场景增长9倍,学习教育等场景也有大幅增长。图:豆包大模型API调用量迅速提升资料来源:火山引擎,国信证券经济研究所整理图:豆包大模型在不同场景迅速渗透资料来源:火山引擎,国信证券经济研究所整理请务必阅读正文之后的免责声明及其项下所有内容豆包视觉理解模型发布,拓宽大模型场景边界•豆包视觉理解模型发布,用户可以同时输入文本和图像相关的问题。模型能够综合理解并给出准确的回答,将极大地简化应用的开发流程,在金融、医疗、教育、旅游等诸多行业有广阔的应用前景。•内容识别能力:精准识别物体类别、形状及物体间关系,理解场景含义,能够推理出物体信息,如通过影子识别猫,通过光照识别丁达尔效应,识别并科普现实对象。•理解和推理能力:识别文字和图像信息实现复杂逻辑计算,解答微积分、分析论文图表、解决物理题及处理真实代码等。•视觉描述与创作能力:模型能根据图像描述创作内容,如为文创产品写祝福语、根据涂鸦创作故事、讲述物体背后的文化故事,以及创作古风诗歌等。•价格:豆包视觉理解模型输入价格仅为0.003元/千tokens,1块钱可处理284张720P的图片,比行业价格便宜85%,目前已经接入豆包App和PC端产品中。 图:视觉理解模型能力增强,场景拓宽资料来源:火山引擎,国信证券经济研究所整理图:视觉理解模型价格远低于同行资料来源:火山引擎,国信证券经济研究所整理请务必阅读正文之后的免责声明及其项下所有内容图:豆包大模型家族资料来源:火山引擎官网,国信证券经济研究所整理大模型家族全面升级:主力模型Doubao-pro升级,对齐 GPT-4o• 豆包通用模型pro完成新版本迭代,综合任务处理能力较5月份提升32%,在推理上提升13%,在指令遵循上提升9%,在代码上提升58%,在数学上提升43%,在专业知识领域能力提升54%。• 豆包通用模型Pro已全面对齐GPT-4o的能力,但使用价格远低于后者,推理输入价格为0.0008元/千tokens。豆包大模型具备行业领先的大模型能力,保持成本优势;应用全面,覆盖广泛通用任务场景;支持联网问答、角色扮演和工具调用,满足精细化业务需求。图:单POD IT耗能测算资料来源:《NVIDIA DGX SuperPOD Data Center Design》,国信证券经济研究所整理请务必阅读正文之后的免责声明及其项下所有内容大模型家族全面升级:音乐、文生图等模型更新发布•豆包·音乐模型4.0发布,从 “高光片段” 走向“完整歌曲”:1)支持包括前奏、主歌、副歌、间奏、过渡段的3分钟全曲创作;2)歌词局部修改,仍能适配原有旋律;3)全曲风格、情感和音乐逻辑保持一致,曲风连贯。•豆包·文生图模型2.1发布:1)一键P图:对中英文、专有名词指令理解精度高;聚焦目标,编辑效果质量高;可实现多元风格,美观自然;2)一键海报:高质量精准生成中文;字体与图片内容巧妙融合;模型最快做到6秒出图,极速生成海报。•veOmniverse+豆包·3D生成模型发布:该模型采用3D-DiT架构,可生成高质量3D模块。该模型与火山引擎数字孪生平台veOmniverse 结合使用,可以高效完成智能训练、数据合成和数字资产制作,成为一套支持AIGC创作的物理世界仿真模拟器。通过快速批量生成并上传至云空间,布局师可实时调用并完成场景设计,提升创作效率。图:音乐模型4.0,支持全曲创作资料来源:火山引擎,国信证券经济研究所整理图:豆包·3D生成模型,快速生成3D场景资料来源:豆包大模型团队,国信证券经济研究所整理请务必阅读正文之后的免责声明及其项下所有内容基于豆包·视频生成模型,即梦成为“想象力的相机”•视频生成模型开放:9月24日,豆包·视频生成模型发布,此后,该模型通过即梦APP和网页端已对C端用户开放使用。面向企业客户和开发者,豆包·视频生成模型将于2024年1月依托火山引擎正式对外开放服务。•基于豆包·视频生成模型,为用户带来创新体验:即梦AI是剪映于今年5月上线的AI内容平台,支持通过自然语言及图片输入,生成高质量的图像及视频。即梦希望成为“想象力世界”的相机,帮助有想法的人轻松表达、自由创作。• 即梦支持动态海报生成 ,文字、画面、排版全面兼顾 •全新的海报生成功能:用户只需通过一句话就可在几分钟内轻松生成设计师水平的海报。即梦支持长提示词理解,用户可通过以引号输入想要生成的具体文字、增加更多描述等方式,满足层次感更强、更有创意的海报需求。•一键变成为动态海报:即梦还拥有将静态海报一键变成为动态海报的能力,让图片具备更强表现力。图:即梦全新海报生成功能资料来源:火山引擎,国信证券经济研究所整理图:即梦海报生成兼顾文字、画面、排版资料来源:火山引擎,国信证券经济研究所整理请务必阅读正文之后的免责声明及其项下所有内容火山引擎AI应用开发平台持续升级,加速大模型的落地运用• 火山引擎AI搜推引擎“发现更多,推荐更准,搜索无限可能”:基于豆包大模型,火山引推出全域AI搜索,提供精准、个性化的搜索推荐,支持文本、图像、音频和视频多模态理解。通过场景化推荐、企业私域信息整合和联网问答服务,搜推引擎帮助企业提升信息获取和搜索效率,具备超大规模吞吐和秒级检索能力。• 扣子1.5发布,让AI离应用再近一步:开发者生态不断完善,已吸引超过1
[国信证券]:计算机行业专题:火山引擎FORCE总结及API收入预期,点击即可下载。报告格式为PDF,大小1.49M,页数15页,欢迎下载。
