人工智能芯片行业:TPU能取代GPU吗?谷歌云计算机器学习即服务脱颖而出的差异化

海外行业报告 | 行业动态研究请务必阅读正文之后的信息披露和免责申明 1 人工智能芯片行业点评证券研究报告 2018 年 02 月 13 日 作者 何翩翩 分析师 SAC 执业证书编号:S1110516080002 hepianpian@tfzq.com 雷俊成 联系人 leijuncheng@tfzq.com 马赫 联系人 mahe@tfzq.com 董可心 联系人 dongkexin@tfzq.com 相关报告 1 《谷歌(GOOGL.US)4Q17 点评:“云+YouTube+硬件”难掩业绩乏力,移动端转型道阻且长;下调至增持,目标价上调至 1260 美元》2018-02-04 2 《人工智能芯片行业:人工智能立夏已至,AI 芯片迎接蓝海;首推:英伟达GPU 王者风范,Google TPU 破局科技》2017-11-29 3 《谷歌 TPU 及强化学习:谷歌 TPU以时间换吞吐量,加速云端 AI 帝国;AlphaGo 从 Lee 到零,探索强化学习新起点》2017-11-22 4 《谷歌(GOOGL.US)3Q17 点评:营收盈利超预期,YouTube 照耀转型路 , 人 工 智 能 巨 头 新 征 途 : 云+YouTube+硬件》2017-10-27 5 《谷歌(GOOGL.US)2Q17 点评:欧盟处罚争议难阻营收盈利超预期,云计算继续发力,人工智能巨头百般武艺扎实前进》2017-07-25 6 《人工智能芯片行业点评:英伟达GPU 王者风范,Google TPU 破局科技;人工智能冲入云霄,看好 GPU、ASIC各领风骚》 2017-05-31 7 《谷歌(GOOGL.US)1Q17 点评:业绩超预期触发市场重估,短期移动端广告+流媒体+云,长期看好 AI 积累,上调 TP 至 1000 美元》2017-04-28 8 《谷歌(GOOGL.US)4Q16 点评:营收稳固超预期,人工智能巨头新征途:云+YouTube+硬件》2017-01-27 TPU 能取代 GPU 吗?谷歌云计算 MLaaS 脱颖而出的差异化 TPU 目前未能取代 GPU,依托云计算拓宽 MLaaS 需求 TPU 目前未能取代 GPU,只是在某些特定算法上做针对性优化。谷歌这次将 TPU 开放给客户是为了提供云计算服务的差异化,提升谷歌云的机器学习即服务(MLaaS)易用性。谷歌目前没有以硬件产品方式出售 TPU 的计划,而是依靠 TPU 浮点运算精度的提高及针对 TensorFlow 的深度优化,以云计算服务形式销售共享。与我们此前强调的一致,我们认为 Google 通过 Cloud TPU+TensorFlow 的软硬结合,以及此后 TPU Pod 的加持,可进一步激活中小企业以及科研单位的云计算需求,另辟 AWS、Azure 之外蹊径。 谷歌云 Q4 单季收入跨越 10 亿美元门槛,但相对于 AWS 51 亿,微软智能云 78 亿的体量尚不能及;AWS 龙头尚稳份额增加 0.5%,微软份额增加 3%为最多;谷歌份额增加 1%。当前包括亚马逊 AWS、微软 Azure 都提供了机器学习基本工具,而通过 TensorFlow API+TPU,Google 提供包括图像识别ResNet-50、机器翻译 Transformer 和物体识别 RetinaNet 在内的主流模型训练开发功能,日后还会提供其他服务。此外 Google 针对 TPU 的使用进行功耗优化,进一步降低数据中心的运营成本。我们认为,云计算巨头为了提高在使用服务器芯片时的议价能力,未来会消防 Google 寻求自主芯片开发的方案,但主要针对特定需求进行定制开发。 ASIC 专用性最好实证,谷歌 TPU 以时间换吞吐量 AI 立夏已至,以 ASIC 为底芯片的包括谷歌的 TPU、寒武纪的 MLU 等,也如雨后春笋。但我们此前强调包括 TPU 在内的 ASIC 仍然面临通用性较弱,以及开发成本高企等局限。TPU 虽理论上支持所有深度学习开发框架,但目前只针对 TensorFlow 做了深度优化。另外 ASIC 芯片开发周期长和成本非常高,在开发调试过程中复杂的设计花费有时甚至会花数亿美元,因此需要谷歌这样的计算需求部署量才能将成本分摊到大量使用中。同时 ASIC开发周期长,也可能会出现硬件开发无法匹配软件更新换代而失效的情况。 TPU 是针对自身产品的人工智能负载打造的张量处理单元 TPU。第一代主要应用于在下游推理端 TPU。本质上沿用了脉动阵列机架构(systolic array computers),让推理阶段以时间换吞吐量。第二代 TPU 除了在推理端应用,还可以进行深度学习上游训练环节。 AI 芯片蓝海仍是 GPU 引领主流,ASIC 割据一地,看好未来各领风骚 我们仍然强调:在人工智能浪潮中,芯片市场蛋糕越做越大,足以让拥有不同功能和定位的芯片和平共存,百花齐放。后摩尔定律时代,AI 芯片间不是零和博弈。我们认为在 3-5 年内深度学习对 GPU 的需求是当仁不让的市场主流。在深度学习上游训练端(主要用在云计算数据中心里),GPU 作为第一选择,英伟达表示 Hyperscale 巨头作为第一波客户在训练端的复购高渗透率正在向推理端延伸,针对数据中心推理的 P4 处理器开始出货,第二波客户则是其他云计算大公司开始放量,第三波客户则是基于云计算的互联网企业海量的数据和 AI 应用计算需求。 而下游推理端更接近终端应用,需求更加细分,我们认为除了 GPU 为主流芯片之外,包括 CPU/FPGA/ASIC 等也会在这个领域发挥各自的优势特点。FPGA 适用于开发周期较短的 IoT 产品、传感器数据预处理工作以及小型开发试错升级迭代阶段等。以 TPU 为代表的 ASIC 定制化芯片,包括英特尔的 Nervana Engine、Wave Computing 的数据流处理单元、以及英伟达的DLA 等,针对特定算法深度优化和加速,将在确定性执行模型(deterministic execution model)的应用需求中发挥作用。我们认为深度学习 ASIC 芯片将依靠特定优化和效能优势,未来在细分市场领域发挥所长。 风险提示:芯片开发周期过长,市场需求不达预期等。 海外行业报告 | 行业动态研究 请务必阅读正文之后的信息披露和免责申明 2 1. 谷歌 TPU:以时间换吞吐量,软硬兼施,冲入云端AI 芯片市场蛋糕越做越大,足以让拥有不同功能和定位的芯片和平共存,百家争鸣非零和博弈。“通用性和功耗的平衡”——在深度学习上游训练端(主要用在云计算数据中心里),GPU 是当仁不让的第一选择,ASIC 包括谷歌 TPU、寒武纪 MLU 等也如雨后春笋。而下游推理端更接近终端应用,需求更加细分,GPU 主流芯片之外,包括 CPU/FPGA/ASIC 也会在这个领域发挥各自的优势特点。 但我们需要强调,包括 TPU 在内的 ASIC 仍然面临通用性较弱,以及开发成本高企等局限。TPU 虽然理论上支持所有深度学习开发框架,但目前只针对 TensorFlow 进行了深度优化。另外 ASIC 芯片开发周期长和成本非常高,在开发调试过程中复杂的设计花费有时甚至会超过亿

立即下载
信息科技
2018-06-25
天风证券
11页
2.15M
收藏
分享

[天风证券]:人工智能芯片行业:TPU能取代GPU吗?谷歌云计算机器学习即服务脱颖而出的差异化,点击即可下载。报告格式为PDF,大小2.15M,页数11页,欢迎下载。

本报告共11页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共11页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
模型风险评价指标
信息科技
2018-06-25
来源:机器学习白皮书系列之四:机器学习流程和算法介绍及金融领域应用实例
查看原文
各个模型多空表现
信息科技
2018-06-25
来源:机器学习白皮书系列之四:机器学习流程和算法介绍及金融领域应用实例
查看原文
各个模型超额收益
信息科技
2018-06-25
来源:机器学习白皮书系列之四:机器学习流程和算法介绍及金融领域应用实例
查看原文
模型分组指标比较
信息科技
2018-06-25
来源:机器学习白皮书系列之四:机器学习流程和算法介绍及金融领域应用实例
查看原文
各个模型第一组表现
信息科技
2018-06-25
来源:机器学习白皮书系列之四:机器学习流程和算法介绍及金融领域应用实例
查看原文
融合模型第一组分年表现
信息科技
2018-06-25
来源:机器学习白皮书系列之四:机器学习流程和算法介绍及金融领域应用实例
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起