所谓“美国疫情数据”,究竟是怎么算出来的?(6)

2021-10-20 17:30     观察者网

约翰斯·霍普金斯大学是一所主校区位于美国马里兰州的研究型私立大学,也是美国第一所研究性大学。2020年1月22日,该校系统科学与工程中心(CSSE)制作了可视化“全球新冠病毒监测地图”。

该校称,随着疫情发展,早在去年2月1日,其数据更新方式就由最初的“手动”(manually)转变为“半自动”(semi-automated)模式——利用计算机程序,自动从数据源中抓取数据,编入数据库并以简洁的形式呈现给大众。

约翰斯·霍普金斯大学的可视化疫情数据地图 截图自其网站

而对于其监测地图的数据来源,JHU称,中国大陆及港澳台地区疫情数据的主要来源是中国数字医疗健康科技企业“丁香园”(DXY),而丁香园的数据来源为“国家卫健委、各省市区卫健委、各省市区政府、港澳台官方渠道公开数据”;而在美国数据方面,JHU称其数据源为“各州县的卫生部门、1point3acres、Worldometers.info等数据聚合网站以及各地方媒体的报道等。

不过观察者网查询发现,上述作为JHU信源的数据聚合网站,其重要数据源也是“各地卫生部门”。更为有趣的是,作为JHU信源的数据网站“1point3acres”,反过来也将JHU的数据作为其信源之一。

尽管如此,与CDC相比,JHU还是凭借着相对迅速、多方数据源等特点,建立起被广泛认为“更胜一筹”的疫情监测数据体系,其数据也被世界各大新闻媒体广泛参考。

不过需要提一句,事实证明:这些看起来“相对可靠”的信息搜集标准也无法成为JHU数据的“完美护身符”。2020年4月14日,其疫情数据就曾发生“乌龙事件”。当天,其数据显示“美国1个多小时内新增10万例确诊”。不过观察者网当时就发文指出,这是由于JHU在统计佛罗里达州数据时出现失误所导致的。

其实,JHU的“乌龙”源自于其数据源“1point3acres”的失误——其平台一位志愿者的手动输入错误:将“103”错误输成“102103”。尽管该错误数据在12分内就被修复,但JHU将之抓取后,便随即迅速在媒体上传播开来,最终引发“乌龙”。

今日关注
更多