计算机行业周报:创数学推理新高,阿里通
2025 年 05 月 07 日 DeepSeek-Prover-V2 创数学推理新高,阿里通义千问推出 Qwen3 模型 —计算机行业周报 推荐(维持) 投资要点 分析师:宝幼琛 S1050521110002 baoyc@cfsc.com.cn 行业相对表现 表现 1M 3M 12M 计算机(申万) 14.6 -4.4 27.8 沪深 300 6.1 -2.2 4.1 市场表现 资料来源:Wind,华鑫证券研究 相关研究 1、《计算机行业周报:豆包 1.5 模型发布,微信 AI 助手“元宝”上线》2025-04-23 2、《计算机行业周报:ChatGPT 升级长期记忆功能,谷歌发布跨平台AI 协作协议 A2A》2025-04-16 3、《计算机行业周报:Llama4 多版本参数亮眼,DeepSeek 公布推理时 Scaling 新论文》2025-04-08 ▌算力: 算力租赁价格平稳,DeepSeek-Prover-V2 创数学推理新高 4 月 30 日,DeepSeek 发布名为 DeepSeek-Prover-V2 的数学推理模型,提供 7B 和 671B 两种参数规模。在多个标准基准测试中,DeepSeek-Prover-V2-671B 都取得了神经定理证明领域的最先进性能水平。并且,面对从著名的 AIME 竞赛(2024 - 2025 年)中挑选的 15 个问题,该模型成功解出了其中的 6 个。 DeepSeek-Prover-V2 通过两阶段训练流程开发,建立了两种互补的证明生成模式:(1)高效非思维链(non-CoT)模式:此模式针对快速生成形式化 Lean 证明代码进行了优化,专注于在不显示中间推理步骤的情况下生成简洁的证明。(2)高精度思维链(CoT)模式:此模式在构建最终形式化证明之前,系统地阐述中间推理步骤,强调透明度和逻辑进展。 与 DeepSeek-Prover-V1.5 一致,DeepSeek-Prover-V2 的两种生成模式由两个不同的引导提示控制。在第一阶段,DeepSeek 团队在课程学习框架内使用专家迭代范式来训练非思维链证明模型,同时通过基于子目标的递归证明为难题合成证明。选择非思维链生成模式是为了加速迭代训练和数据收集过程,因为它提供了明显更快的推理和验证周期。在此基础上,第二阶段利用了通过将 DeepSeek-V3 复杂的数学推理模式与合成形式证明相结合而生成的冷启动链式思维链数据。CoT 模式通过进一步的强化学习阶段得到增强,遵循推理模型常用的标准训练流程。 在性能测评环节中,DeepSeek 团队用定理证明基准数据集,对 DeepSeek-Prover-V2 进行系统评估,测试覆盖高中竞赛和本科数学知识。结果显示,即便训练数据多为高中数学题,该模型仍能良好泛化到大学水平问题,体现出强大的形式化推理能力。 ▌AI 应用: Gemini 平均停留时长环比 +3.45%,阿里通义千问推出 Qwen3 模型 4 月 29 日,阿里通义千问宣布推出 Qwen 系列大型语言模型的最新成员——Qwen3。阿里通义千问的旗舰模型 Qwen3-235B--40-200204060(%)计算机沪深300证券研究报告 行业研究 证券研究报告 请阅读最后一页重要免责声明 2 诚信、专业、稳健、高效 A22B 在代码、数学、通用能力等基准测试中,与 DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro 等顶级模型相比,表现出极具竞争力的结果。此外,小型 MoE 模型 Qwen3-30B-A3B 的激活参数数量是 QwQ-32B 的 10%,表现更胜一筹,甚至像 Qwen3-4B 这样的小模型也能匹敌 Qwen2.5-72B-Instruct 的性能。 Qwen3 模型支持两种思考模式:思考模式:在这种模式下,模型会逐步推理,经过深思熟虑后给出最终答案。这种方法非常适合需要深入思考的复杂问题。非思考模式:在此模式中,模型提供快速、近乎即时的响应,适用于那些对速度要求高于深度的简单问题。这种灵活性使用户能够根据具体任务控制模型进行“思考”的程度。例如,复杂的问题可以通过扩展推理步骤来解决,而简单的问题则可以直接快速作答,无需延迟。至关重要的是,这两种模式的结合大大增强了模型实现稳定且高效的“思考预算”控制能力。 Qwen3 预训练数据集规模大幅提升,相比 Qwen2.5 近乎翻倍,达约 36 万亿个 token,覆盖 119 种语言。数据源于网络与 PDF 文档,经多模型提取、优化。预训练分三阶段,先构建基础能力,再强化知识数据训练,最后扩展上下文长度以处理长输入。 Qwen3 的发布是阿里通义千问的又一里程碑。对比 Llama 4 系列模型得到的社区反馈,Qwen 系列无疑已经成为全球第一的开源模型。据了解,阿里通义已开源了 200 余个模型,全球下载量超 3 亿次,Qwen 衍生模型数超 10 万个,已超越 Llama,成为全球最大的开源模型族群。 ▌AI 融资动向: 身份验证平台 Persona 获 2 亿美元融资,估值达 20 亿 5 月 1 日,身份验证初创公司 Persona Identities Inc. 宣布完成 2 亿美元 D 轮融资。本轮融资由 Founders Fund 和 Ribbit Capital 领投,原有投资方 BOND、Coatue、First Round Capital 和 Index Ventures 跟投。此轮融资后,Persona 估值达到 20 亿美元。 作为一家总部位于旧金山的创业公司, Persona 为包括 OpenAI、Instacart 在内的 3000 多家客户提供云端身份验证解决方案。该平台提供预制组件,帮助开发者快速构建注册表单,并可根据风险等级动态调整验证步骤。 Persona 利用人工智能技术扫描上传文件,检测篡改痕迹和过期证件。系统还会分析设备信息、用户行为特征等多维数据,并提供恶意账号集群识别等高级功能。该公司在 2024 年完成了超过 3 亿次身份验证,客户数量和营收均实现翻倍增长。 Persona 联合创始人兼 CEO Rick Song 表示:"在 AI Agent 时代,身份验证的挑战不仅会增长,还会倍增。真正的难点证券研究报告 请阅读最后一页重要免责声明 3 诚信、专业、稳健、高效 不再是识别机器人,而是验证每个行为背后的身份,以及他们是否值得信任。" 在 AI Agent 崛起的背景下,身份验证正从简单的人机识别,升级为更复杂的可信度评估体系。Persona 通过 AI 技术整合多维数据,打造智能化身份验证基础设施,为元宇宙、Web3 等新兴场景提供关键支撑。这反映了 SaaS 赛道在 AI 时代的演进方向 - 从工具化向智能化升级。 ▌投资建议 微软和 Meta 最新财报双双超预期,云业务和 AI 成增长引擎。微软第三财季营收达到 701 亿美元,同比增长 13%,净利润为258 亿美元,同比增长 18%。强劲的云业务是推动增长的关键引擎。微软的商业云(Commercial
[华鑫证券]:计算机行业周报:创数学推理新高,阿里通,点击即可下载。报告格式为PDF,大小0.85M,页数15页,欢迎下载。
