2019 新型冠状病毒扩散的可视化

2019 新型冠状病毒扩散的可视化

科学研究,媒体报道,展示数据,理解事件

The Sociologist 2.025.jpeg

本文收集总结的资讯自 2020 年 1 月 25 日起至 2 月初,此后不再更新。各研究机构、新闻传媒及个人对病毒传播的可视化项目不断增加,既有项目也不断完善。建议从文中提供的链接查看更新,或利用检索工具查询新资讯。

前文所述,流行病早在「全球化」之前就已不是单一国家的事。国内较为年轻的民众了解疫情,多采用丁香园的整理页面,除了更新速度快、来源权威、数据清晰外,其中一个重要原因是可视化较为明了合理——全国地图展现不同地区实时疫情扩散情况与严重程度,趋势图的快速增长而远未见顶警醒人们提高防范意识。但丁香园但数据集中于国内1,或许是因为其他国家和地区暂时未爆发严重至此,或许国内权威媒体报道缓慢,难以配合国内数据更新,或许……

本文简单收集我在 2019 新型冠状病毒爆发后所关注的研究机构、国际媒体与组织在报道和研究中,对疫情数据所做的可视化案例。就在文末不写总结了,放在这里:

Contents

科研机构

JHU CSSE

CleanShot 2020-01-25 at 06.02.11@2x.png

约翰斯·霍普金斯大学土木与系统工程系所属的系统科学与工程中心(The Center for Systems Science and Engineering,CSSE)长期进行社会与健康问题的跨学科研究,近年来追踪寨卡病毒、麻疹等。针对武汉疫情,他们制作了这个 GIS 页面,追踪病例并可视化。数据来自世界卫生组织、美国疾病预防控制中心、欧洲疾病预防控制中心、中国疾病预防控制中心、中国卫生应急办公室和定香园等,也是所有可视化项目中数据来源最为广泛、透明的。

HealthMap

CleanShot 2020-01-25 at 06.58.18@2x.png

HealthMap 由波士顿儿童医院的研究人员、流行病学家与软件开发者于2006年成立,利用线上非正式渠道监测疾病爆发,实时监测新出现的公共健康威胁。HealthMap 的数据来源包括网络新闻、目击者报告、专家讨论和有效官方报告等,如世界卫生组织、世界动物卫生组织、联合国粮食及农业组织、ProMED Mail、GeoSentinel、Google News、百度新闻等。

MOBS Lab

CleanShot 2020-01-25 at 07.21.59@2x.png
image.png

ISI 基金会、美国东北大学等组织机构联合开发了这套全球流行病与流动模型(GLEAM),以有效地限制传染病造成的社会和经济损失,预测流行病的时空演变,评估现有遏制和预防策略的潜在影响。MOBS Lab(Laboratory for the Modeling of Biological + Socio-technical Systems)隶属美国东北大学网络科学研究所,同多个机构合作,包括 SCNARC、世界卫生组织等,主要开发传染病传播模型,研究社会人类行为,模拟复杂社会和技术网络进化等。

研究人员对 2020 年 1 月 23 日前的武汉疫情进行了感染传播风险的模型分析,使用以个人为基础的流动模型对疫情程度同国际传播风险在较长时间尺度下进行了评估。最终结果中位数为 5900 例感染[95% CI: 2,900-10,500]。

WorldPop

上图左至右、上至下分别为湖北省与武汉市六个月内人口迁移模式、北上广六个月内每日人口迁移模式、农历正月初一前两周外地传入个案与武汉传入风险相关性、春节期间中国大陆各城市接受来自武汉感染旅客风险、中国大陆各省份接受来自武汉感染旅客风险、中国大陆春节后接受来自 18 个高风险城市感染旅客风险、中国大陆春节后接受来自 18 个高风险城市感染旅客风险连通性预测、农历正月初一前十五天至农历正月十五后两个半月期间接受中国大陆 18 个高风险城市旅客的全球前三十位城市地理分布、农历正月前十五天至农历正月后两个半月期间接受中国大陆 18 个高风险城市旅客的非洲城市地理分布。

南开普敦大学 WorldPop 项目始于 2013 年,结合此前已有的 AfriPop、AsiaPop、AmeriPop 等国际人口绘图项目,以开放存取方式提供空间人口数据集档案,解决传统人口数据集时效性不足、粒度低、规模小等问题,旨在应对灾害与公共卫生问题。其建立的空间人口数据库可用于疾病负荷预测、流行病模型、灾害管理、资源分配、交通与城市规划等方面。因其开放性与透明性也被广泛使用,如美国疾病预防控制中心、世界卫生组织、联合国粮食及农业组织、世界银行等。

本研究利用 2013 年至 2015 年的百度定位服务(LBS)的中国国内人口流动数据,以及 2018 年的国际航空运输协会的国际航空旅行数据,探讨武汉至中国其他城市旅客流动模式,预测新型冠状病毒农历新年期间中国及世界范围内蔓延风险。

Virological

Virological 是一个关注病毒分子进化和流行病学的论坛,目前已有 2019-nCov 的子目。上图为牛津大学 Moritz Kraemer、华盛顿大学助理教授 David Pigott 等人依据其与其他学者共同维护的数据库所绘制,收录年龄、性别、地理信息、旅行史等数据,也发于 GitHub 发布。其他研究人员的帖子就不一一列举,感兴趣可自行查看。

Nextstrain

Nextstrain 系关注病原体基因组数据的科学与公共健康的开源项目,提供不断更新的公开、可用的数据视图,并提供可视化工具供社区使用,旨在帮助了解流行病学及改善疫情应对。上图为 2019-nCov 的基因组流行病学系统发生树,展示病毒的进化关系。有一篇关于如何使用 auspice 的教程

HGIS Lab

image.png

华盛顿大学人文地理信息系统实验室(Humanistic GIS Laboratory)制作了冠状病毒的互动地图,更新数据来自美国疾病预防控制中心、世界卫生组织、中国、香港、澳门和台湾以及其他政府机构数据。


新闻媒体

The New York Time

纽约时报将事件更新的时间线与追踪扩散情况的地图分为两个页面。数据来自中国国家卫生健康委员会与当地政府,下方的感染估算数据来自上述 MOBS Lab。地图采用 OpenStreetMap。接连的两张地图——亚洲与欧美,则使用不同比例尺,红圈大小难以比照,极易造成对感染程度的的误读。

alt

另一篇专题报道中,纽约时报利用一张图表比较了新型冠状病毒同其他传染病。但这张图中表示致命性的垂直轴为对数尺度,而非线性尺度,即较大数字被拉回平均值,较小数字分布开。这使得表中红色方框的部分,顶部十分靠近 SARS,或给读者以新型病毒的致死性接近 SARS 的错觉。但这篇报道的英文原文中在此图表下加注了一段对这一问题对说明,而中文版中则不知什么缘由略去了这一段。(再次证明了:有能力还是直接读原文吧 🤷‍)

Bloomberg

彭博社则直接采用一张世界全图,避免了不同比例尺对数据呈现的影响。并且在第一页以大字号展现重要数字,带给读者对疫情严重程度的直观感受。地图所采用的数据除了来自中国中央政府的公开数据外,还有丁香园、世界卫生组织等。

最后一张柱状表中的大城市封锁数据,则综合武汉市统计局、英国国家统计署、美国普查局和世界银行,希望藉此展现武汉封城影响巨大。但这似乎有以真实的数据进行不相关比较之嫌,因为并未给出其他城市封锁的原因,且每个城市人口基数不同,交通运载能力与地位也不同,单以受影响人数并不能得出什么结论。彭博社似乎也知道这点,文本上什么也没说。

CNBC

image.png

CNBC 不单网页界面交互粗糙,所谓可视化新闻似乎也如此。正文中的描述与结论都未能通过图表反映出来,而这个看似可以交互的图表,则极难操作。地图左下方标注的来源,即上文中的 CSSE,然而 CSSE 自己并不收集生产原始数据,他们也是参照了各方数据而绘制自己的地图。从某种程度上来说,这篇能算得上是「假新闻」了。

The Washington Post

虽然华盛顿邮报的这个页面说的是「spread」,却并未从能图表中看出来。第一张图是截取自球面,地图绘制方式多种多样,也无可厚非,但还是容易使大多数人产生是否产生图像畸变的疑惑。不论地图中,还是整篇报道,都没有给出更新日期和事件,也没有给出数据来源。另外华盛顿邮报的网站似乎对广告阻拦插件零容忍。

Business Insider

image.png

同华盛顿邮报一样,Business Insider 的地图也会给大多数读者眼前一懵的感受。为了避开「WUHAN」,将「China」移至西藏区域,也容易产生误读。而除了武汉,其他地区完全采取同样的颜色,又没有标注确诊数,无法得知各地疫情程度差异。标注原始数据来源方面,也是完全不及格。

NBC News

NBC 取 19 日至 24 日的各国确证病例数字绘制折线图,横纵轴的单位比例并不能表现出在较短时间内的较多人数增长。而将确诊千人的中国同其他仅个位数的国家放在一起,更是不知所云。唯一值得一提的是,数据来源除了多采用的中央一级行政部门,也有省市一级以及央媒报道。

Sky News

Sky News 或许是到目前为止我看到的第一篇在可视化中真正展现出「spread」的报道。通过一个地图灯箱,描述了武汉肺炎分六个阶段扩散至世界各地的过程。虽然更新时间清晰,但数据来源则标注得略显含糊,不过也比同参与 The Truth Project 的华盛顿邮报表现更佳。

The Guardian

IMG_2215.PNG

卫报建立了较为直观的时间线,且更新较为迅速。在地图中表示存在感染病例的国家,展现疫情的全球影响,并不强调个国家地区的严重程度差异。只是在桌面端浏览时,地图会被切割为两行,只有在移动设备商横屏阅读时才能获得更佳效果。

SCMP

南华早报很好地运用各式图表讲述了新型冠状病毒在中国及全球传播、对人体的影响、其爆发于武汉的缘由,及其远超 SARS 的表现。在地图呈现方面,较多运用点分布,而非填充,避免了数据呈现的解读问题。世界地图投影相较其他新闻媒体页面,兼顾了展示美观与方便理解。

The Initium

立足台湾和香港的端传媒虽然每天在汇总疫情,也刊登了多篇报道与评论文章,其中也由其设计部制作可视化图表,但直至今日(3 Feb 2020)才发布单独的疫情动态页面。不过并没有标注数据来源,而在单独报道中也仅模糊标注,难以获取。

中国大陆的新闻媒体

左至右分别为:

各家国内网媒都对疫情做了实时追踪的移动终端页面,基本采取同一格式——一张全国地图、一张趋势图、一张各省市及其他国家地区确诊人数表,再加上新闻时间线。

其中丁香园更新最为迅速即使,被国际媒体广泛采用。在确诊人数表一项,除了丁香园,都将其他国家地区都疫情状况列入其中。网易新闻与百度的页面中未有采用疫情趋势图。(至 26 Jan 2020,丁香园也在确诊人数表中增加了其他国家疫情)。

其他媒体也有制作类似页面,如 MedSci第一财经知乎人民网每日经济新闻等。之所以不在列出,是因为这些页面不但没什么出彩之处,还存在数据更新缓慢、资讯来源模糊,以及界面丑陋等问题。

实施疫情情况通过地图表现严重程度,有多种表现手法,但国内媒体大多采用颜色深浅表示不同区间,实际造成湖北以外各省市难以差异化,感受不明显。而国内媒体掌握的交通流动资讯也较为丰富,未见有根据交通客运情况与疫情扩散做对比分析或风险提示的。截止本次更新(20:00 25 Jan 2020),香港特首林郑月娥才在几小时前宣布无限期暂停来往武汉航班及高铁。

alt

澎湃新闻则是目前为止(00:00 26 Jan 2020)我所见的国内媒体中的实时地图做的最好的,由澎湃的可视化团队美数课所制作。上述的其他媒体所制地图的缺点都不存在于此,肺炎爆发情况不止以颜色深浅表示,动画可直观回顾疫情发展,且对桌面端和移动端响应式处理,对读者较为友好。

除了实时动态页面,澎湃也在单独报道中将数据以图表形式展现,如一图看懂|湖北等30省份启动的一级响应是什么?“封城”24小时内,武汉飞机出港逐渐停止,也都由美术课制作。

但在一级响应一文中,以颜色深浅的方式展现各地启动时间的先后却是有些不太合适,因为各地疫情不一,也不适合简单地认定先后存在什么优劣之分。若能似实时地图或民航出港情况,以动态形式表达,将更为合理。而公共卫生突发事件分级的图表紧接着一级响应地图,「II 级别(严重)」的橙色易使读者将其同上图中「1月24日」的淡红色混淆,可分开排版或明确区分。

其他

Wikipedia

维基百科的编纂与媒体或研究机构不同,是去中心化的。因此在协同作业中,图表辅助正文的作用更加凸显。在这篇词条中,参与维基百项目 4 年多的董辰兴与其他用户共同编辑和更新大中华地区的感染地图,绘制了多张医学图片与美国全国及各州地图的 Pharexia 依据美国疾病控制与预防中心数据绘制了扩散至美国及全球的地图,利用香港政府公开数据绘制了去年香港运动的多张图表的 Cypp0847 依据香港卫生防护中心文件制作了在港疑似病例的折线图与分布图,何一飞使用 R 生成的柱状图表可寻得来源页面与网页存档。因维基百科编纂词条有着较为成熟的流程与规范,这些图表的原始数据有据可查,且可视化配合文本事实描述。只是在互动性上略有欠缺。



  1. 截至此文发布之时,即 25 Jan 2020。丁香园在后来也加入了其他国家和地区的统计数据。文中除非特别标注,皆基于发布文章的时间的状况。

Some rights reserved
Except where otherwise noted, content on this page is licensed under a Creative Commons Attribution-ShareAlike 4.0 International license.