腾景宏观快报:大数据疫情观察(二):全国疫情高峰过了么?——基于腾景AI高频模拟和预测
请务必阅读本报告尾部的重要声明http://www.tjresearch.cn2022年12月23日大数据疫情观察(二):全国疫情高峰过了么?本期要点:相关报告《腾景宏观快报:大数据疫情观察:中心城市率先迎来峰值》2022-12-16《腾景宏观快报:美国11月CPI同比继续加速回落,或为7.3%》2022-12-03《腾景宏观快报:类通缩状态下,大规模消费刺激或将成为2023年实现5%左右潜在增长水平的关键》2022-11-29010-65185898 | +86 15210925572IR@TJRESEARCH.CNhttp://www.tjresearch.cn北京市朝阳区朝阳门外大街乙6号朝外SOHO-A座29层联系我们——基于腾景AI高频模拟和预测腾景宏观快报腾景高频和宏观研究团队第1页 | 共17页• 针对预测到底准不准,全国疫情是否已经见顶的问题,我们增加了28个城市的地铁客运量日度数据进行辅助判断。非网民样本的缺失可能会导致预测结果有偏。• 大数据不完美,应用大数据做宏观经济预测并非完美无缺,我们分析了谷歌流感趋势何以失灵。原因可能包括:媒体对谷歌流感趋势(GFT)的大幅报道导致人们的搜索行为发生了变化,用户的搜索行为反过来也会影响GFT的预测结果。• 当前全国疫情或尚未达峰,但是达峰进程可能会有所提前。借助地铁客运量数据进行辅助验证,我们判断北京、石家庄、武汉、重庆等城市已经度过疫情峰值,成都、天津、长沙、南京、西安等城市尚未达峰。请务必阅读本报告尾部的重要声明http://www.tjresearch.cn2022年12月23日第2页 | 共17页一、预测到底准不准?预期与现实相互验证•在上期《大数据疫情观察:中心城市率先迎来峰值》报告中,我们分析并给出了北京和河北部分城市疫情已经迎来“拐点”,成都、昆明等城市将陆续见顶的预测判断。根据百度搜索指数数据,北京百度“发烧”搜索指数持续下降,“咳嗽”搜索指数后于“发烧”见顶,这基本上印证了我们模型的预测。但是,我们也注意到2022年12月17日(上周六)全国范围内“发烧”指数见顶,这是否意味着全国疫情的见顶?如果这样,这个数据与一些防疫专家的春节前后见顶的判断就有所出入。也有专家认为全国疫情可能虽然尚未达峰,但是进程缩短了。•但根据字节跳动的“巨量算数”,抖音“发烧”搜索指数于12月17日见顶,但头条“发烧”搜索指数仍在震荡上行。在朋友圈广为传播的知乎“数据帝”的预测里面,2022年12月20日前后大部分省市相继达到感染高峰,那么,很多研究者都想确认的是,站在2022年12月23日,全国范围内的单日新增感染有没有达峰?有人认为预测很准,和自己这些天在互联网上对疫情的感知较为一致;有些人则认为不准,认为身边的亲戚朋友们都阳了,而预测进度条还不到一半,个人体感和预测结果有较大差异。•与此同时,我们注意到了在2022年12月16日前后,全国几乎所有城市、省份“发烧”搜索指数迎来了“先扬后抑”的脉冲式增长,后续日度数据再也没有高于16日当天的值。这意味着疫情最艰难的阶段已经度过了么?通过对百度、头条疫情病症搜索引擎数据进行数据挖掘和建模分析,可以为疫情未来趋势研判提供重要参考。不过我们理解,为了定量评价疫情进展,还需要引入更多数据。•由于没有权威数据作为参考,各类疫情的预测仅仅是基于直觉、推理或演绎的带有参数的模型预测,预测准不准,缺乏客观权威作为结果比较,所以很难客观衡量预测是否准确,只能通过参与这件预测的所有观众和读者通过微观的数据,周围疫情扩散程度去验证预测结果,一个城市不同群体感染的先后,不同城市感染达峰的节奏,都会对预测是否准确有不一样的理解。请务必阅读本报告尾部的重要声明http://www.tjresearch.cn2022年12月23日第3页 | 共17页•模型有局限性,逻辑假设的适用性,缺乏权威数据作为验证,难道就不需要预测了吗?托马斯·库恩(Thomas Kuhn)和卡尔·波普尔(Karl Popper)就“科学哲学”这个概念展开了20世纪最具影响力的对峙。他们都以自己的方式深奥地从哲学的角度质疑科学的基本前提。库恩的《科学革命的结构》(The Structure of Scientific Revolutions)指出,即使现有的范式所预测的结果在现实中存在反例,现有的科学家也不会认为其范式有问题;只有可替代现有范式的新科学范式出现,并且反例达到了一定的数量,现有科学范式才可能被证伪,科学革命才会发生。从批判的角度来看对预测过程的否定也是发现新预测方法的过程。•量子基金的乔治·索罗斯(George Soros)推崇的哲学家卡尔·波普尔(Karl Popper)最著名的观点是科学是通过“可证伪性”(Falsifiability)进行的——人们无法证明假设是正确的,甚至无法通过归纳法获得真理的证据,但如果假设是错误的,则可以反驳它。根据波普尔的观点,只有可被经验证伪的理论体系才应被赋予真正的科学地位。因此,波普尔提倡大胆假设,用证伪的方式去不断试错,不断修正,而不是提出假说,然后到处找支持自己理论的根据。“证伪”也是索罗斯所一直推崇与实践的思考方式。二、地铁客运量作为疫情达峰的重要辅助观察指标•因此,我们从疫情出发,回到经济,从多维度验证疫情的峰值。地铁客运量无疑是很好的观察指标,一个有地铁城市的客运量受若干因素影响:1、出行管制,2、出行意愿,3、地铁的便利程度。•从数据上来看,北京、上海作为全国地铁保有量最高的两个城市,也是日均客运量最高的两个城市,地铁数据较高的反映了疫情的高低,同时地铁客运量的日度数据公布滞后1-3天,还算比较及时,从数据收集角度看,地铁数据来自于物联网设备自动采集,人工干预的影响较小,数据具有充分的客观性,可以作为疫情的第二类主要观察变量。请务必阅读本报告尾部的重要声明http://www.tjresearch.cn2022年12月23日第4页 | 共17页图:上海地铁客运量数据来源:Wind、腾景AI经济预测•上图是2019年12月至今的上海地铁客运量数据,比较明显的是2020年初的武汉疫情,2022年4月的上海疫情,和2022年12月的全国疫情。由于地铁客运量遵循周一至周五高,周六日低的原则,日度数据信息量有些冗余,后续我们通过比较周度平均数据,可以过滤短期的日内数据波动。图:上海地铁客运量(7日移动平均)数据来源:Wind、腾景AI经济预测•比较北京地铁客运量,也可以看出2022年4月,上海地铁停运7周左右,北京虽然没有停运,但周度地铁客运量均值从近三年日常的800万降低到100万以下。值得注意的是,2022年9月之后的北京地铁客运量明显低于上海,这一方面是疫情,另一方面也是北京地铁需要全网查验72小时核酸,11月24日进一步缩短到48小时,12月5日起这一政策被解除。请务必阅读本报告尾部的重要声明http://www.tjresearch.cn2022年12月23日•基于此数据,我们认为北京疫情高峰已过,但全国整体疫情高峰并非如百度搜索指数和头条指数显示的那样已经见顶,而是处于快速发展期。我们建立了四阶段数据模型,辅助验证各城市是否达峰。如下图所示,北京、武汉、重庆、沈阳、石家庄、
[腾景数研]:腾景宏观快报:大数据疫情观察(二):全国疫情高峰过了么?——基于腾景AI高频模拟和预测,点击即可下载。报告格式为PDF,大小1.83M,页数17页,欢迎下载。
