软件与服务行业AI产业跟踪:DeepSeek开源DeepSeek~OCR,持续关注AI大模型技术路径演进与商业化进展

请阅读最后评级说明和重要声明 丨证券研究报告丨 行业研究丨点评报告丨软件与服务 [Table_Title] AI 产业跟踪:DeepSeek 开源 DeepSeek-OCR,持续关注 AI 大模型技术路径演进与商业化进展 报告要点 [Table_Summary]10 月 20 日 DeepSeek 开源 DeepSeek-OCR 模型,3B 参数,为实现高效视觉-文本压缩而设计的 VLM,通过光学二维映射技术压缩长文本上下文可行性的初步探索,提供降本新思路。模型使用视觉模态作为文本信息的有效压缩媒介,在端到端模型测试中以最少的视觉 token 数达到了最先进的性能。持续关注后续大模型视觉架构的演进。DeepSeek-OCR 模型有望打破算力约束、重新定义大模型上下文处理方式的新路径。当前时点继续看好国产 AI 产业链,持续重点推荐铲子股和卡位优势显著的巨头本身。 分析师及联系人 [Table_Author] 宗建树 刘思缘 SAC:S0490520030004 SFC:BUX668 %%%%%%%%research.95579.com1 请阅读最后评级说明和重要声明 丨证券研究报告丨 更多研报请访问 长江研究小程序 软件与服务 cjzqdt11111 [Table_Title2] AI 产业跟踪:DeepSeek 开源 DeepSeek-OCR,持续关注 AI 大模型技术路径演进与商业化进展 行业研究丨点评报告 [Table_Rank] 投资评级 看好丨维持 [Table_Summary2] 事件描述 10 月 20 日 DeepSeek 开源 DeepSeek-OCR 模型,3B 参数,专为实现高效视觉-文本压缩而设计的 VLM,首次提出“上下文光学压缩(Contexts Optical Compression)”,通过文本转图像实现信息的高效压缩,目前已在 Hugging Face 开源。 事件评论 ⚫ DeepSeek-OCR 模型核心价值在于验证了视觉 token 可以更高效地表达信息。通过光学二维映射技术压缩长文本上下文可行性的初步探索,提供降本新思路。当文本 token 数量在视觉 token 的 10 倍以内(即压缩率<10×)时,模型的解码(5OCR)精度可达 97%;即使在压缩率达到 20×的情况下,OCR 准确率仍保持在约 60%。这一结果显示出,通过使用视觉模态作为文本信息的有效压缩媒介,在长上下文压缩和 LLM 的记忆遗忘机制等研究方向上具有相当潜力。 ⚫ 应用价值高,在端到端模型测试中以最少的视觉 token 数达到了最先进的性能。OmniDocBench 基准测试中,以 100 个视觉 token 超过 GOT-OCR2.0(256token/页)的表现;以不到 800 个视觉 token 优于 MinerU2.0(平均 6000+token/页)。在实际生产环境中,每日可在单张 A100-40G GPU 生成超过 20 万页(200k+)LLM/VLM 训练数据。多轮对话中,模型可以通过光学压缩的方式折叠旧对话内容,让过去的上下文以更低的计算成本被保留,从而在理论上实现无限上下文的架构。 ⚫ 泛化能力强、应用场景广。(1)深度解析(OCR 2.0):模型能够对图表、几何图形、化学公式、自然图像进行深度解析,比如能将金融报告里的图表直接转成结构化数据,化学结构式转成 SMILES 格式,只需使用一个统一提示词(prompt)即可完成。(2)多语言识别:针对 PDF 文档支持近 100 种语言的识别。(3)通用视觉理解:具备一定程度的通用图像理解能力。我们认为,OCR 模型的突破进一步扩展模型能力与场景的边界,有望 DeepSeek-OCR 成为文档智能领域的基础组件。 ⚫ 架构突破,提出一种新的视觉编码结构 DeepEncoder,实现高分辨率下高效提取视觉特征并显著减少视觉 token 数量。架构分为三部分:(1)核心是 DeepEncoder,SAM-base(提局部特征)+CLIP-large(提全局语义)串联,中间有两层 16x 卷积模块,能把 1024×1024 输入从传统~4096 个视觉 token 压缩到约 256 个 token(支持多档分辨率模式)。(2)轻量 MoE 解码:文本解码器(DeepSeek-3B)使用 MoE 结构(64 个专家,激活6 个),实际推理只用到约 570M 参数,效率比全量 3B 模型高。训练流程上分两阶段,先单独训练 DeepEncoder(视觉部分),再全模型联合训练(视觉+语言)。 ⚫ 持续关注后续大模型视觉架构的演进。我们认为,当前成本依然是制约 token 消耗量的核心因素,OCR 模型有望打破算力约束、重新定义大模型上下文处理方式的新路径。当前时点继续看好国产 AI 产业链,持续重点推荐铲子股和卡位优势显著的巨头本身。 风险提示 1、AI 技术发展不及预期; 2、下游应用需求不及预期。 市场表现对比图(近 12 个月) 资料来源:Wind 相关研究 [Table_Report]•《2025 年第 42 周计算机行业周报:短期 Token数据波动不改 AI 长期趋势》2025-10-20 •《2025 数博会开幕,聚焦可信数据赋能产业发展》2025-10-20 •《低轨 12 组卫星发射成功,关注卫星互联网产业投资机遇》2025-10-20 -20%0%20%40%2024/102025/22025/62025/10软件与服务软件与服务沪深3002025-10-22%%%%%%%%research.95579.com2 请阅读最后评级说明和重要声明 3 / 5 行业研究 | 点评报告 风险提示 1、AI 技术发展不及预期,本次大模型创新伴随参数量及模态的增速能力天花板尚未达到,但模型效果本身仍存瓶颈及问题,倘若 AI 技术发展不及预期,投入厂商仍然存在失败风险。 2、下游应用需求不及预期,人工智能本质是通过供给创新催生需求扩容,目前大模型仍处于商业模式摸索期,倘若本轮技术变革无法真实带动下游需求,投入厂商将受到影响。 %research.95579.com3 请阅读最后评级说明和重要声明 4 / 5 行业研究 | 点评报告 投资评级说明 行业评级 报告发布日后的 12 个月内行业股票指数的涨跌幅相对同期相关证券市场代表性指数的涨跌幅为基准,投资建议的评级标准为: 看 好: 相对表现优于同期相关证券市场代表性指数 中 性: 相对表现与同期相关证券市场代表性指数持平 看 淡: 相对表现弱于同期相关证券市场代表性指数 公司评级 报告发布日后的 12 个月内公司的涨跌幅相对同期相关证券市场代表性指数的涨跌幅为基准,投资建议的评级标准为: 买 入: 相对同期相关证券市场代表性指数涨幅大于 10% 增 持: 相对同期相关证券市场代表性指数涨幅在 5%~10%之间 中 性: 相对同期相关证券市场代表性指数涨幅在-5%~5%之间 减 持: 相对同期相关证券市场代表性指数涨幅小于-5

立即下载
信息科技
2025-10-23
长江证券
5页
0.63M
收藏
分享

[长江证券]:软件与服务行业AI产业跟踪:DeepSeek开源DeepSeek~OCR,持续关注AI大模型技术路径演进与商业化进展,点击即可下载。报告格式为PDF,大小0.63M,页数5页,欢迎下载。

本报告共5页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共5页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
本周公告通信股重要股东增减持
信息科技
2025-10-23
来源:通信行业研究周报:ESUN成立重塑IDC互联格局,卫星两日连发加速建设
查看原文
本周(10.13-10.17)通信板块个股涨跌幅前十
信息科技
2025-10-23
来源:通信行业研究周报:ESUN成立重塑IDC互联格局,卫星两日连发加速建设
查看原文
同花顺盈利预测表(截至 2025 年 10 月 22 日收盘)
信息科技
2025-10-22
来源:2025年三季报点评:市场活跃推动业绩高增核心业务持续向好
查看原文
2020-2025Q3 同花顺销售商品、提供劳务收到的现金及增速
信息科技
2025-10-22
来源:2025年三季报点评:市场活跃推动业绩高增核心业务持续向好
查看原文
2020-2025Q3 同花顺经营活动产生的现金流量净额及增速
信息科技
2025-10-22
来源:2025年三季报点评:市场活跃推动业绩高增核心业务持续向好
查看原文
2020-2025Q3 同花顺合同负债及增速 图4:2020-2025Q3 同花顺销售、管理、研发费用率
信息科技
2025-10-22
来源:2025年三季报点评:市场活跃推动业绩高增核心业务持续向好
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起