一项新的研究发现,电信提供商常规收集的手机数据可以揭示被诊断患有流感样疾病的人的行为变化,同时还可以保护他们的匿名性。在的美国国家科学院(PNAS)的论文发表的研究,由计算机科学家在Emory大学领导的,以从2009年爆发的冰岛H1N1流感的绘制数据。
“据我们所知,我们的项目是第一个将独立收集被动收集的手机元数据与实际的公共卫生数据关联起来的严格的重大研究,”埃默里大学计算机科学系助理教授Ymir Vigfusson说,该研究的第一作者。“我们已经证明,在不包含隐私的情况下可以做到这一点,而且我们的方法可能会提供有用的工具来帮助监测和控制传染病的爆发。”
研究人员与冰岛一家主要的手机服务提供商以及该岛国的公共卫生官员合作。他们分析了超过90,000个加密手机号码的数据,这些数字约占冰岛人口的四分之一。他们被允许将加密的手机元数据链接到1400名匿名个体,这些个体在H1N1爆发期间接受了流感样疾病的临床诊断。
维格夫松说:“个人的联系是关键。” “在COVID-19大流行期间出现了许多用于智能手机数据的公共卫生应用程序,但它们往往基于相关性。相比之下,我们可以确定性地衡量被诊断人群与其他人群之间常规行为的差异。”
结果显示,平均而言,接受流感样诊断的人在诊断前一天和之后的两到四天内改变了手机的使用行为:他们从更少的唯一位置拨打了更少的电话。平均而言,他们在诊断后第二天拨打电话所花的时间也比平时更长。
这项研究在COVID-19大流行之前很久就开始了,历时10年完成。Vigfusson说:“我们正在进入新的领域,我们想确保自己在做一门好科学,而不仅仅是快速科学。” “我们认真努力地开发了保护隐私的协议,并对数据进行了严格的分析。”
Vignusson是数据安全以及开发可大规模使用的软件和编程算法的专家。
他与之前的两个学生分享了该研究的第一作者:雷克雅未克大学的研究生Thorgeir Karlsson,他在Emory工作了一年,并在该项目上工作。计算机科学系的学生。来自布里斯托大学和大英图书馆艾伦·图灵研究所的资深作家莱昂·达农构想了这项研究。
Vigfusson指出,虽然只有大约40%的人类可以使用Internet,但手机拥有率很高,即使在中低收入国家也是如此。他补充说,手机服务提供商通常会收集计费数据,以提供有关人群日常行为的见解。
Vigfusson说:“ COVID大流行提高了人们对监视和衡量传染病暴发进展的重要性以及它本质上与时间赛跑的认识。” “越来越多的人也意识到,我们的一生中可能会爆发更多的流行病。拥有正确的工具以迅速向我们提供有关流行病爆发状态的最佳信息至关重要。”
隐私问题是过去手机数据未与公共健康数据链接的主要原因。对于PNAS论文,研究人员制定了一项艰苦的协议以最大程度地减少这些担忧。
手机号是经过加密的,其所有者不是通过名字来识别,而是通过一个不向研究人员透露的唯一数字标识符来识别。这些唯一的标识符用于将手机数据链接到已取消标识的健康记录。
Vigfusson说:“我们能够在整个过程中保持个人的匿名性。” “手机提供商没有了解任何个人的健康诊断,而卫生部门也没有了解任何个人的电话行为。”
这项研究涵盖了15亿个通话记录数据点,包括拨打的电话,通话的日期,通话源的基站位置以及通话的持续时间。研究人员将这些数据与医疗服务提供者在中央数据库中对流感样疾病的临床诊断相关联。无需实验室确认流感。
数据分析集中在每个临床诊断前后的29天,并研究了移动性,呼叫次数和呼叫持续时间的变化。他们在相同的时间段内对位置匹配的控件测量了这些相同的因素。
Vigfusson说:“尽管单个手机每天仅产生几个数据点,但我们仍能看到一种模式,即在人们被诊断出患有流感样疾病时,其行为有所不同。”
Vigfusson补充说,虽然发现是重要的,但它们仅代表着可能广泛使用该方法的第一步。当前的工作仅限于冰岛的独特环境:一个只有一个入境口岸,人口相当齐整,富裕且人口少的岛屿。它也仅限于单一传染病H1N1,以及那些经过临床诊断为流感样疾病的人。
Vigfusson说:“我们的工作有助于讨论哪种匿名数据沿袭可能对公共健康监测有用。” “我们希望其他人可以继续努力,研究我们的方法是否可以在其他地方和其他传染病中使用。”