您现在的位置是:LG博客 > 大数据 >

邬贺铨院士点评大数据抗疫:价值初显,但还可以更好

2020-02-28 11:57:2352人已围观

摘要: 要想真正发挥大数据的价值,还有赖于真实数据的开放、信息安全系统的建立和个人信息保护法律体系的完善。

  面对疫情大考,大数据展现出在疫情防控、物资调度、智能诊断等多个领域的价值。但我们是否应该为这张答卷“打满分”?邬贺铨院士分析指出,大数据在科学防控、精准施策方面还有很深的研究空间。

  未来,要想真正发挥大数据的价值,还有赖于真实数据的开放、信息安全系统的建立和个人信息保护法律体系的完善。

  01 “大数据抗疫”为什么成为可能?

  习总书记指出“要运用大数据等手段,加强疫情溯源和监测” 。这是对大数据作用的肯定,也是对互联网行业的一个要求。

  现在手机已经成为我们个人的另一张身份证。

  中国和全球相比较,我们在2018年移动通信普及率是112%,全球是106%。独立移动通信用户(扣除了一户多号)的普及率82%,接近发达国家的水平。我们移动互联网的普及率也高于全球平均水平。可以说,我们国家有独立活动能力的人几乎都有手机,而且中国实行手机用户实名制,通过手机用户即可识别持有人的身份。

  一般手机在待机的时候,用户也会从一个小区移动到另一个小区,这时候手机要不断接受基站发出的测量信号,通过读取基站下发的重选参数,选择最优小区进行驻留。在非待机情况下,重选实际上就是切换过程之一部分。因为用户一直在移动,而蜂窝半径又比较密,秒级的接收重选信息周期才能跟得上用户的位置更新,可以说信令数据具有实时性。

  运营商利用移动通信信令可以知道用户所在小区,可以判断处于哪一个街区或乡村,定位精度在城市为百米级(200~300米)。利用移动终端至三个基站的物理距离关系,得到到达时间(ToA)或到达时间差(DToA),或得到移动终端至两个基站的到达角度(AoA),再由基站的定位服务器综合计算出移动终端位置,定位精度可改进到数十米。5G因基站更密,而且引入更为多样化的参考信号,定位精度有可能达到比米级更优。

  全球导航卫星+数字地图可提升定位精度。

  我国2019年4G用户占移动用户比例超过80%,均为智能手机用户。智能手机装有GPS或北斗系统,通常定位精度数十米,空旷地方精度可到米级,但无法定位室内用户。

  数字地图公司基于车载GPS等导航卫星接收装置,对城市所有马路扫街得出道路与小区楼栋准确经纬度数据。现国内某公司就拥有7000万活跃POI位置点数据。不过GPS定位的坐标系标准与我国地图标准坐标系不同,两者的转换会带来不同程度偏差。

  通常装有数字地图APP的手机只要开机并启用定位功能,便会发送GPS等新的位置信息到数字地图公司,基于卫星+数字地图比基于移动通信基站的位置分辨率高但覆盖不全,只限于装有数字地图APP的用户。以我国某知名数字地图公司为例,现有7亿下载用户,占全部移动用户的43%,覆盖率不到一半。

  在这次疫情初期,我国的数字地图公司纷纷给出的人口迁徙大数据地图,它可以回溯武汉春节前将近500万人流到什么样的地方去,虽然没有覆盖全部手机用户,但也有很好的代表性。

  我们从中可以分析疫情扩散走势,可以看出从武汉迁出的目的地以湖北境内为主。

  有了这些数据,怎么来推测疫情的传播呢?

  国际上一般使用一种叫SEIR的模型,它把人群分为4种,I是已经感染的人群,E是密切接触者,S是目前健康的,R是在最后可能康复的。北大陈宝权教授团队进行了一些改进,提出了C-SEIR模型,增加了P和Q两类,P是疑似人群,Q是确诊人群,他们从国家及各省市地区卫健委公布的地级市每日确诊数据出发,通过热度图和曲线图等数据可视化方式来展示疫情传播特点。

  在1月22日之后,各地政府采取了严格措施和大众对防疫意识高度重视,将这些因素考虑进去,可以得到疫情蔓延的可视化地图。上述模型假设这个城市中感染者与未感染者之和是常数,即不考虑城市有新的流入和流出人群,对封城之后的武汉市是成立的,但其他城市不一定。实际上,利用电信的信令大数据可以将流入和流出的人口都考虑进去,使得模型更精确。

  02 疫情之下,大数据具体做了什么?

  疫情的可视化表现可以有很多种方式,北大可视化实验室和美国雪城大学合作,每个省为一个方框,用颜色和图像表达全国各地每日累计确诊数(背景色)、治愈率(绿色面积占比)和死亡率(黑色面积占比)及其变化,定性和直观。

-