人工智能行业点评:OpenAI访问限流,GPT-4算力测算
请务必阅读正文之后的免责声明及其项下所有内容证券研究报告 | 2023年03月20日超 配1人工智能行业点评OpenAI 访问限流,GPT-4 算力测算 公司研究·公司快评 计算机 投资评级:超配(维持评级)证券分析师:熊莉021-61761067xiongli1@guosen.com.cn执证编码:S0980519030002证券分析师:朱松021-60875155zhusong@guosen.com.cn执证编码:S0980520070001事项:OpenAI 对于 Plus 付费用户的 GPT-4 访问连续下降阈值,GPT-4 访问限制由第一天的 150 msg/ 4 hr 到100 msg/4 hr 到 50msg/3 hr 到最近的 25msg/3hr。在较短的时间内 GPT-4 下降了 4 次访问阈值。评论: ChatGPT-4 的访问被持续限流OpenAI 对于 Plus 付费用户的 GPT-4 访问连续下降阈值,GPT-4 访问限制由第一天的 150 msg/ 4 hr 到100 msg/4 hr 到 50msg/3 hr 到最近的 25msg/3hr。在较短的时间内 GPT-4 下降了 4 次访问阈值。对于 GPT-4的限流,OpenAI 的官方回复是“开发者可能会对使用 GPT-4 的应用程序或者服务施加类似限制,以确保合理的资源分配,避免滥用或者控制成本。通常这类限制取决于 API 访问限制或者特定的订阅服务”。官方主要从控制成本的角度对 GPT-4 访问量进行优化,也明确了限流几乎只针对 GPT-4。图1:ChatGPT-4 访问被限流资料来源:OpenAI 官网,国信证券经济研究所整理 OpenAI 限流的背后是其日活和周活用户数的持续攀升由于功能的强大以及回复率准确的高企,ChatGPT 的日活和周日跃用户数量屡创新高,截止 3 月 15 日,ChatGPT 日活突破 5837 万(3 月 13 日的日活用户数据是 4846 万,两天新增接近 800 万日活),截止到 3月 9 日这周,ChatGPT 周度的活跃用户数量为 331.81 万,相比上一周活跃用户数量增加了接近 25 万。GPT的日活和周度活跃用户数量持续攀升,一方面是 GPT4 的能力更加强大,使用的体验更加流畅、回复的答请务必阅读正文之后的免责声明及其项下所有内容证券研究报告2案更加精准、上下文溯源的能力更加强大,使得越来越多的用户加入到体验和运用模型的队伍中来,另一方面是因为经过此前 GPT-3 经历后的付费用户数量越来越多。目前,OpenAI 没有提价,对于 Plus 会员的价格还是 20 美金/月,但是随着用户数量的持续增加,预计限流的动作会持续。 OpenAI 的需求持续增长将持续推高算力成本ChatGPT 应对终端访问,每 1000 tokens 需要算力成本 0.02 美金,3 月 3 日 OpenAI 发布 GPT-3.5-turbo ,对外开放 API 接口,宣称算力成本下降 90%,1000 tokens 算力成本下降到 0.002 美金。目前,以英伟达DGX A1OO 服务器作为计算资源,采用云服务单天成本约为 460 美元,假设按照 ChatGPT 日活 1300 万人,每个人每天平均 1000 字的问题(共计 173.3 亿个 token),假设峰值为一天均值的 5 倍,那么需要 602 万台 DGX A100 服务器,每天的租用成本为 27.77 万美金,平均到每 1000 个 token 的推理成本为 0.02 美金左右(详细的测算过程欢迎参考前期报告《人工智能行业点评:ChatGPT 对算力的需求究竟如何?》)。目前,GPT-3.5-turbo 的算力成本下降了 90%达到 0.002 美金每 1000 个 tokens,我们预期模型的参数有所下调(此前测算成本按照 GPT-3.5 的模型参数 3000 亿个进行测算),此结果和用户对于 new bing 不及Chat GPT 本身交互准确的感受相一致。预计 GPT-4 的算力消耗量远大于 GPT-3 和 GPT-3.5-turbo。目前根据根据 GPT-4 的公开数据,在 8K 的上下文长度下,每 1000 个 token 的提问成本为 0.03 美金,每 1000 个 token 的回答完成成本为 0.06 美金;在32K 的上下文长度下,每 1000 个 token 的提问成本为 0.06 美金,每 1000 个 token 的回答完成成本为 0.12美金。这个算力成本相比与 GPT-3 的成本(每 1000 个 tokens 的算力成本约为 0.02 美金)上升了较高(输入成本增加 50%-200%,输出升本增加 200%-500%),相比于 GPT-3.5-turbo 的成本上升更为可观,输入成本增长了 14-29 倍,输出成本增长了 29-59 倍。图2:ChatGPT-4 访问价格资料来源:OpenAI 官网,国信证券经济研究所整理预期在应用逐步增长的背景下,GPT 的算力成本将进一步攀升。目前 OpenAI 主要的用户为 C 端用户,未来有望逐步扩大到 B 端领域,GPT-3.5-turbo 下降精度降低算力成本以适应更多的应用场景是扩大生态中坚实的一步。随着 GPT 生态的建立、相关应用的爆发,算力的需求将持续扩大。目前,根据微软的数据,Bing的日活首次突破 1 亿(集成搜索+聊天功能的必应预览版自推出以来总聊天次数已超过 4500 万次),目前GPT 的日活数量接近 5800 万,Bing 日活 1 亿用户,假设 NewBing4000 万日活,其他应用 4000 万日活,合计 1.4 亿日活。假设普通 98.5%的用户使用 GPT-3.5-turbo,1.5%的用户使用 GPT-4,那么 98.5%普通用户的一天的算力成本在 28 万美金左右(对应 607 台 DGX A100 系列服务器),而 1.5%付费使用 GPT-4 的用户的算力成本为每天 840 万美金(对应 1.8 万台 DGX A100 系列服务器)。具体测算和假设如下:1)98.5%的用户使用 GPT-3.5-turbo,每个人每天问 1000 tokens,按照每 1000 tokens需要算力成本 0.002 美金计算,每天的成本大概为 28 万美金,对应 607 台 DGX A100 系列服务器;2)1.5%付费用户使用 GPT-4,每个人每天 1 万个 tokens,按照目前 GPT-4 给出的最低价格(每 1000 个 tokens 0.06美金),那么算力成本为约 840 万美金,对应 1.8 万台 DGX A100 系列服务器。而根据微软在 2019 年的公告,投资 OpenAI 10 亿美金,投资 1 万个 GPU 建设 Azure AI 超算平台,可以预见的是,算力将很快被 OpenAI的 GPT 模型消耗完,这也是 OpenAI 此前持续公布限流的原因之一。随着 OpenAI 官方公告 6.14 号开出 GPT-4 的 API 接口,按照目前用户数量和问询数量的趋势,公司必须做请务必阅读正文之
[国信证券]:人工智能行业点评:OpenAI访问限流,GPT-4算力测算,点击即可下载。报告格式为PDF,大小0.52M,页数5页,欢迎下载。
