难道你觉得数学模型仅仅能够于实验室之内进行演算么?南开大学的教授凭借代码对病毒轨迹予以追踪,使得数据能够表达观点。在疫情的迷雾当中,这群数学家变成了处在另一条战线之上的侦察兵。
当数学系教授拿起疫情数据
黄森忠教授开展传染病模型的研究已然过去了二十年,然而,将其模型切实用以实战的时间,乃是2020年1月23日武汉实施封城的那一日。彼时,他身处南开大学的统计楼内,目光紧盯着屏幕的时候,察觉到传统的SEIR模型根本难以适配新冠病毒,因为新冠病毒在潜伏期便具备传染能力,无症状状态下同样能够传播,这样全新的传播方式迫使他必须推倒原有的模型并重新构建。从大年三十一直到正月初六这段时间里,他带领着研究生,每日仅仅休息四个小时,凭借着不懈的努力,硬是成功地重新架构了普适的SEIR模型。国家卫健委所公布的确诊病例数量,在他的眼中并非是毫无温度的数字,而是病毒四处流窜进而留下的踪迹。
南开大学成立智英健康数据研究中心之际,黄森忠未曾料到这么迅速地就迎来严峻考验。这个由物美集团创办人张文中捐赠资金而设立的组织,原本将目标对准慢性病大数据,疫情出现后全体人员转而投入新工作。中心所开发的 EpiSIX 程序原本是用于分析流感的,团队成员连夜修改代码,在三天之内让这套系统能够处理新冠数据。可视化网页上线的那一日,点击率从几百急剧上升至三万,网友首次看到确诊人数被制作成日历热图。
三次迭代让预测精度提升40%
初期时起,研究团队的主要预测侧重全国总量,然而,在二月初之际,却发觉湖北与浙江的传播曲线全然不是同一状况。一月三十日,发布第一期报告之时,他们仅能给出全国、湖北、武汉这三个尺度的预判,直至二月十四日,第六期时已然细化至每个省份。评价指标也历经三轮变换:初期关注新增确诊拐点,中期计算隐形感染者规模,后期直接预测防控措施每逢收紧一日所能压平的病例数。由山西大学的靳祯教授负责对模型参数进行校准,南京医科大学的彭志行副教授把控着流行病学逻辑,这样一种跨校的组合使得预测报告既保证了数学方面的严谨性又贴合临床实际情况。
2月10日,团队有过分歧,有成员提议将复工潮影响写入预测,然而黄森忠坚持等到铁路售票数据出来才动笔,最终报告推迟12小时发布,新增了人口流动变量,结果表明若返程客流管控松动,2月下旬可能再次出现小高峰,教育部后来反馈,这份报告直接对高校延期开学的决策节奏产生了影响。
EpiSIX程序如何啃下硬骨头
这套程序起初是针对分析体检数据所编写,疫情爆发之后首个遇到的难题是数据格式不相兼容,国家卫健委每日公布的确诊总数仅有寥寥几行字,然而模型却需要年龄分层、地域关联以及接触史链条,研究生团队逐个查阅各省卫健委官网,将零散公布的病例详情逐一扒下来进行人工编码,在最为崩溃的那一日,天津新增病例数据于半夜更新,三名研究生从宿舍摸黑返回机房重新运行模拟,直至凌晨四点才看到新的预测曲线与实际情况的误差仅仅为1.7%。
媒体现在标配的是由程序生成的日历图,代表单日确诊破千的是红色格子,零新增呈现为灰色格子;直接把代表重大事件的标签戳在日期上,这些事件是封城、建方舱、全员核酸,2月5日那周连续三天呈现为深红色,黄森忠在图上标注了“雷神山交付”,团队里有人小声嘟囔:这种关联性能够证明因果关系吗?教授没有进行争论,仅仅是调出了同期武汉医疗资源承载力的数据链,将其叠放在日历图的下层,懂行的人一看就明白,床位扩容与确诊高峰之间存在五天的滞后。
师生接力背后是校友百年前埋的线
传说中的南开数学系1979级,出现了一个堪称传奇的班级,张文中是其中一员,黄森忠同样是其中一员。在四十年之后,当张文中进行捐资去建设健康数据中心之际,特意点名要让身为老同学的黄森忠来负责掌控大局。当这笔资金在2018年到达之时,主要是拿来用于培训基层医生去解读影像片,然而谁都未曾预料到新冠疫情竟会使其转变成为战时指挥部。团队里身为90后的研究生王雨晨讲道,张文中学长并未给中心设定过任何一项具体的指标,仅仅在疫情刚开始的初期打过一通电话,说道“南开数学人的手不要处于闲置状态”。
这种传承并非仅仅局限于资金方面。黄森忠给学生讲授模型的第一课,就拿出了1979年他们班手算传染病数据的作业纸复印件。那张纸上没有计算机打印出来的图表,全都是在坐标纸上手绘的曲线,而且边缘还有茶水渍。如今研究生用EpiSIX生成预测只需要十分钟,然而黄森忠依旧要求他们必须通过手算来验证前三天的数据,算不完就不准下班。
从武汉预测到各省市模型用了哪些狠活
当全国模型下降到省域的时候,团队发觉江苏与河南的传播阻力全然不在同一个量级。人口的密度、交通枢纽的地位、基层组织的响应速度,这些变量在普适SEIR模型里原本是用平均值来替换的,细分之后参数一下子就膨胀了三倍。彭志行副教授找出自己在2015年做手足口病模型时的旧数据,发觉江苏县级医院检测效率比全国均值快1.8倍,这个系数被放入新版模型后,江苏预测准确率直接从62%跃到89%。
2月12号那一天,也就是湖北临床诊断病例被纳入统计的日子,全国确诊数一下子暴增了一万四。团队成员没有惊慌,黄森忠做出判断,认为这是统计口径发生了切换,并非是疫情出现了恶化,然而模型必须立刻进行适配。研究生李泽轩修改代码,一直改到凌晨三点,他新增了“诊断标准变更日”这个虚拟变量,新模型所跑出的湖北疫情曲线,与后一周的实际数据拟合度达到了0.96。后来,这套应急修改方案被疾控系统收录成为了经典案例。
数据预测能为基层决策解决什么实际问题
由河南信阳某街道办主任在接受采访期间所讲,于2月上旬时,他们依据南开预测报告对卡口轮班密度作出了调整。该报告表明在当地倘若维持一级响应状态,那么在2月17日前后新增病例将会全部归零。鉴于基层人力存在着一定的局限性,就在这个时间节点使得他们有底气把三班倒转变为两班倒,进而节省出人手去监管复工企业的消毒情况。这并非是单独的个例——浙江温州依靠预测模型提前经过三天的时间锁定了重点返乡人群,重庆渝北区运用区域版模型精准计算出了方舱床位的冗余量。
教育部曾在内部对黄森忠团队的工作作出评价,认定其最大价值并非预测有多精准,而是将“不确定性”纳入量化框架之中。卫健委官员于非公开会议间引用了EpiSIX所生成的武汉疫情热力图,称以往做决策凭借的是经验判断力度是否足够,如今能够计算出封城每延长一日所对应的感染减少数量。尽管这些表述黄森忠从未对外提及,仅仅是让学生再次敲了敲日历图上2月7日的标签:“李文亮医生辞世”。
在哪一些事例当中,数学模型对现实领域决策做出了改变,是你于最近这段时间所见到过的呢?请来到评论区域,分享出你身旁存在的量化方面的力量,通过点赞以及转发的行为,使得更多的人从而能够看见中国学者所展现出的硬核抗疫情况。





