加州伯克利教授:美国或在4月10日至14日达病例最大值

美国是全球累计确诊新冠病例数最多的国家。作为全球疫情的震中,美国的疫情何时结束?当地时间4月3日,加州大学伯克利分校教授Slav Hermanowicz在预印本网站medRxiv发布论文,通过建模预计:美国的新冠报告病例数可能在4月10日至14日左右达到最大值。

Slav Hermanowicz教授是美国加州伯克利大学土木与环境工程系教授,高端外国专家项目专家,IWA编委,欧洲科学和艺术学院成员,同济大学、慕尼黑工业大学、北海道大学等多所国际知名学府客座教授。

据美国约翰斯·霍普金斯大学新冠肺炎疫情最新统计数据显示,截至北京时间4月6日凌晨1时20分(美东时间4月5日13点20分),美国累计确诊病例324052例,累计死亡9180例。

Hermanowicz教授曾通过中国疫情前22天的数据(到2020年2月6日)近乎实时地分析了中国新冠疫情的演变。在这项新研究中,他使用了中国截至2020年3月13日的87天数据以及美国截至3月31日70天的数据,通过Logistic模型进行系统评估以预测美国疫情的增长。研究者估算了模型参数集(最大病例数“K”、增长率“r”和中途时间“t0”)和疫情“结束时间” ——t95(“t95”的定义为预测或实际病例数达到95%的最大值的时间)。

这些参数是根据每天增长的报告病例数进行的预测的。不过在这两个国家中,K的估计值在指数阶段和近指数阶段时会随着时间的增长快速增长,这使得长期预报K值并不可靠。相比K值,该模型对时间的预测更为重要——即t95的区间预测。中国的“结束时间” t95的估算值为60天至70天,实际值为67天,即2月22日,此时中国达到最大病例数的95%。对于美国,Hermanowicz教授通过输入从现在起往前推两周的数据,模型估算的“结束时间”值范围为70到80天之间。如果美国流行病的行为与中国先前的发展相似,则报告的病例数可能在4月10日至14日左右达到最大值。

Logistic模型及其应用

Hermanowicz教授在之前的研究中使用了简单的Logistic模型,用来分析中国国家卫健委报告的COVID-19病例数据,并推算疫情的演变。最初的分析分三个阶段进行(1月30日、2月3日、2月6日)。分析得出了一系列不断更新的关于疫情动态的预测。随着新数据的获得,最大病例数的预计值会持续增加,然而该预测会系统地低估最终报告的病例数。不过,该流行病的连续预测动态非常接近最终的实际结果。

在最新的研究中,研究者进一步探讨了这个问题,并使用了完整的中国大陆报道数据来对疫情进行系统的反向估计。

在进行这项研究时,美国正在经历疫情的快速暴发。作者认为,美国的疫情在某些方面类似于中国,但总体来说有所延迟。研究者运用对中国疫情的分析经验,来预测美国新冠病毒病例的进一步发展。研究者对美国疫情的预测基于当前可用的数据(不考虑任何其他可能的次要感染源,诊断或报告标准的变更或病毒的突变)。

研究者提到,对疫情和感染动态进行建模非常重要,最近关于全球COVID-19暴发的研究正大量发布。不过许多报告的模型太复杂,不仅包含了初步假设,还需要估计一些不太可靠的参数。

在这项工作中,研究者将非常简单的Logistic模型拟合到可用数据,并预测最新的感染结果。与其他模型相比,Logistic模型不包含任何外部假设,并且完全从可用数据中得出。

Logistic模型是人口动态中最简单的模型之一,长期以来一直专门应用于流行病领域。在我们对中国流行病发展的早期分析中,由于该模型结构简单且易于计算,因此使用了离散模型。

在离散时间内(更适合于每日报告的感染病例),Logistic模型变为:

其中P(t)和P(t + 1)是连续几天的人数(病例数),R0 *是Logistic增长开始时的增长率(流行病学中的基本传染数),而K是极限人数(最大病例数)。

然而,用连续时间t表示种群P的增长可以将模型公式化为一个普通的一阶微分方程,该方程描述了种群P的动态演变(在本研究中为感染者数量),并受增长率r和最大病例数K的控制。 在连续时间t中,P变化为:

最初,P的增长接近指数级,因为(1 )几乎为1。 当P变大(与K相称)时,增长率随着

成为有效的瞬时增长率。

方程(2)的解,是众所周知的S形函数(logistic函数)

其中,t0是病例数达到最大值一半P(t0)= 1 2 K的时间。使用模型的微分版本会更方便,因为存在闭式解,并且可以直接估计三个模型参数:K,r和t0。Logistic模型可能足以分析整个中国大陆和整个美国,因为此时每个国家都可以视为一个单元,其中发生的绝大多数病例没有任何显著的“输出”或“输入”。

数据分析

分析中国的疫情发展时,研究者使用了国家卫健委截至2020年3月13日(疫情爆发的第87天)每天报告的数据,仅有11例新增病例——比总病例数乘以2×10的负4次方还少,研究者认为这意味着国家层面已经有效地结束了疫情。

论文中提到,关于中国疫情暴发的确切日期,有很多不同的说法,大部分指向12月中旬。另外有一些分析表明有多个原始感染源,同时疫情最初暴发时未能被确认。

在Hermanowicz教授的分析中,则采用2019年12月17日作为疫情暴发的起点。此外,在流行的最初阶段,由于对疾病知之甚少、无症状感染者的存在,报告的病例数可能远低于实际病例数。只有在疫情发展到一定阶段,才能估计出更准确的数。

来自中国的数据显示,累计病例数呈S形增长。在美国,有大量的机构根据美国各级的政府公布的COVID-19病例数进行疫情追踪。研究者采用了基于网络数据的聚合(主要是州级)数据,进行每日病例更新。

研究者以2020年1月21日作为美国疫情的开始时间(第1天),当天报告了美国第一例非撤侨的新冠病例。研究者表示,与中国一样,由于相同的因素(无症状携带者,最初的认识不足,有限的检测),初始阶段的病例数也被低估。尽管存在这些问题,但这项工作中使用的数据是当前可获得的最佳数据。

中国和美国的数据也都以半对数形式绘制,以强调该流行病在最初阶段的指数增长。在中国,指数增长阶段从第30天开始直到到第42天结束,用虚线表示。在第42天(1月28日)之后,病例数仍在增加,但增长率正在降低,代表累积病例的线与指数曲线偏离。

在美国,指数增长发生的时间较长,直到最近(3月27日至30日)才开始偏离指数曲线。

模型估计和结果

对于中国和美国的报告累积病例数的数据集,研究者估计了逻辑模型的三个参数(最大病例数“K”、增长率“r”和中途时间“t0”),使模型预测与数据拟合。研究者使用定制的非线性曲线拟合程序,该程序采用Levenberg-Marquardt方法。 与Hermanowicz教授之前的工作相似,研究者从日渐增长的数据集中估算模型参数。

对于中国,第一个数据集包含从第38天到第42天的5天。下一个估计值使用了从第38天到第43天的6天。重复此过程,直到使用中国病例数据集的第87天。对于美国,第一个数据集还包含从第43天到第47天的5天。美国可用序列的最后一天是第70天(2020年3月30日)。所有得出的估算值均显示在附录中。

在中国疫情增长已基本结束,研究者就以顺序估计过程(反向回推)模拟了疫情动力学的近实时分析。而美国仍处于疫情实质性的增长阶段,连续估算是几乎实时进行的。除了三个模型参数外,研究者每天还估计流行病结束的预计时间。即预测的病例数达到预估最大K的95%时,通过设置P(t)= 0.95 K。

中国

如Hermanowicz教授此前进行的分析,预测的最大病例数K,在很大程度上取决于用于估计的数据集的长度。例如,图5显示了一些logistic曲线,这些logistic曲线对应着中国特定日期所选模型参数的估计值。如该图所示,初始估计(接近指数阶段)低于20000,但随着更多数据可用并用于估计细化,它们增加到大约100000。显然,从完整数据集(直到第87天)获得的K估计值与实际报告的病例数(80780与80807)是的非常匹配的,但应注意,从第65天起便已非常接近收敛的实际最大值。

由于第57天(2月12日)中国报告标准的变化,报告病例数突然激增。如前所述,研究者决定在任何后续分析中使用所有数据(带有跳转)。直接结果是估计的最大案例K有了很大的增加(图3),从第56天的约50000到第59天的约99400大约翻了一番。这一巨大的增长再次凸显了Logistic模型对数据质量的敏感性。但是,由于对K的固执迅速收敛至其最终值,也展示该模型在长期预测时具有强大的鲁棒性。

同样,由于病例数量的增加,t95的估计值也出现了大幅增长。但是,值得注意的是,“结束时间” t95的估计受到更多限制,并且更接近于实际值。甚至早在流行病结束前的三周的时候,对“结束时间”的估计值就落在60到70天之间的范围内,非常接近实际的最终值——67天。

美国

与中国不同,美国的疫情仍处于增长阶段。因此,可用的数据集要小得多,Logistic模型的估计值不确定性也要大得多。图3中显示了当前对最大病例数K的估计值。它们显示出非常大变动范围,从第47天的约1100增加到第70天的约265000,没有任何平稳的迹象。如此大的变化并不意外,因为美国疫情目前近乎指数的增长,没有包含关于实际最大值的足够信息。换句话说,方程式中的导数dP / dt由项r P主导,而(1- P / K) 1。这在选定的估计参数——K、r、t0的预测Logistic曲线中也可见到(图6)。

“结束时间” t95的顺序估计值绘制在图4中。随着报告病例数的增加,它们的时间也趋于增加,但与K估计值不同,它的变化要小得多。根据过去两周的数据,结束时间应该是介于70到80天之间。研究者认为,如果美国疫情发展与中国的情况相似,可以预期“t95”会在略高于80天的时间内进一步趋于平稳。 如果这一大胆的预测得以维持,可以看到疫情增长将在暴发后大约80-85天左右结束,即4月10日至14日结束。当然,这里的结束被定义为不再有显著的新增病例,而不是新冠患者完全康复。

若文章对您有帮助,帮忙点个赞!

0
-4
发布时间 2020-04-06 21:54:10
0 条回复(回复会通过微信通知作者)
点击加载更多评论
登录 后再进行评论
(微信扫码即可登录,无需注册)