您现在的位置是:LG博客 > 大数据 >

大数据时代,我们真能依靠手机和社交网络控制

2020-02-28 13:47:19140人已围观

1911192223lw.jpg

随着我们对疫情越来越了解,我们将不得不提出一个更难回答的问题:疫情将走向何方?它会不会演变成一场流行病?

现代信息和传播技术为我们提供了另一套研究工具,用于从事与上面所讨论的生物技术进步有所区别又互为补充的研究工作。事实上,当你阅读这句话时,一些这样的技术工具正躺在你的口袋里。

当越来越多的国家采用电子医疗记录时,世界各地的人都可以直接通过手机报告自己的健康问题,以此加强与医疗网络的联系。这些信息不仅将为报告身体有恙的患者提供更有效的治疗,而且当分析大量用户的信息时,健康异常现象将被更迅速、敏锐地侦查出来。发展到最后的反应系统,能够识别出标志一种流行病开始的异常的健康问题集群。至此,数字流行病学时代真正到来了。

被手机公司搜集的数据,使我们都成了迅速侦查出重要人类事件的潜在传感器。内森 · 伊戈尔(Nathan Eagle)对此做了细致的研究。他是麻省理工学院媒体实验室成员,将呼叫数据记录应用于广义问题的开拓者之一。伊戈尔和同仁们合作,旨在通过挖掘呼叫数据记录了解地震情况。伊戈尔和其研究团队在卢旺达研究呼叫模式数据达3年之久,其中包括对2008 年2月3日那关键一星期的数据研究。当天基伍湖地区发生了5.9 级地震。通过设立呼叫频率的基准数据,伊戈尔和其团队能够发现地震之后那段时期呼叫模式异常的蛛丝马迹。他们能够通过呼叫数达到的一个峰值,来确定地震时间,也能够利用来自手机信号塔的定位数据确定震中即呼叫量最大的位置。

利用手机数据侦查出地震时空信息的想法着实令人惊讶,它也暗示了一系列不同的手机数据应用。患者可能跟健康人有着本质上不同的呼叫模式。当一个新疫情向外扩散时,呼叫模式也可能发生改变。单单分析呼叫数据记录,可能对一个新疫情的早期侦查而言不尽完美,但结合我们和其他卫生机构组织提供的疫情资料,也许能帮助我们勾勒流行病早期的扩散趋势。

如今手机的使用越来越普遍,这可能成为疫情演变成流行病之前,迅速发现和应对疾病的利器。然而在日益发展的数字监控领域,手机并不是以技术为主的唯一解决方案。2009 年我在谷歌的同仁们发表了一篇令人关注的论文,表明个人在线搜索模式也提供了人们所患传染病的信息。

通过采用谷歌保存的海量搜索数据以及美国疾控中心搜集的美国流感监控数据,研究团队能够校准监测系统,确定病患和其护理者所使用的、表明疾病出现的搜索关键词。研究团队通过搜索与流感及其症状、治疗相关的单词,建立了一个预测流感趋势的系统,比美国疾控中心提供的流感统计准确率更高。而事实上,谷歌团队做得更好:谷歌搜索数据即刻就能获得,美国疾控中心流感监测数据却有滞后的问题,因为需要时间来报告和发布。先于传统监控系统提供准确的流感趋势预测,谷歌由此击败了美国疾控中心。

谷歌流感趋势系统所提供的有关季节性流感的早期数据很有趣,并且有潜在的重要性。这一早期数据让卫生机构有时间订购药物,以满足不同病情之需。但是季节性流感的早期侦查不是我们的终极目标,我们的目标是建立一个能够发现一种新兴流行病的系统。谷歌现在正努力将疾病侦查范围从流感扩展到其他种类的疾病。当越来越多的人使用谷歌这样的搜索引擎,我们就可以获得越来越多的数据。我们所希望的是,除流感之外其他感染源的趋势分析也做得越来越好。也许有朝一日,我们仅仅谷歌搜索一下,就会发现一种流行病正在某社区兴起。

社交网络的迅猛发展,提供了另一组大数据,使我们有可能会发现即将到来的疫情信息。这些信息虽然微弱,但有潜在的价值。像英国布里斯托尔大学的计算机科学家威斯利斯 · 莱普(Vasileios Lampos)和奈勒·克里斯蒂亚尼尼(Nello Cristianini)已经采用与谷歌科学家们相类似的方法,对数以亿计的 Twitter 信息进行整理。像他们在谷歌的同仁们一样,莱普和克里斯蒂亚尼尼使用关键词观察 Twitter 上的流感趋势,发现其与流感统计具有相关性。这里的流感统计是指英国健康保护署(UK’s Health Protection Agency) 提供的数据。

2009 年在甲型 H1N1 流感病毒大流行时期,他们追踪 Twitter 中与流感相关的信息的出现频率,并将结果与官方卫生数据比对,发现准确率达到97%。与谷歌流感趋势研究团队的研究成果一样,莱普他们的研究提供了一个既快捷又具有潜在廉价性的流感研究方式,作为传统流行病数据收集的补充。这种研究方式也可能扩展到对流感以外疾病的研究。

-