去年8月的一天,美国特拉华州威尔明顿市内穆尔/阿尔法雷德爱杜邦儿童医院医学遗传学家Karen Gripp接待了一位年仅4岁的患者。
这个小女孩虽比同龄孩子稍矮,且已经失去了大部分乳牙和几颗已经长出来的成年牙齿,但并没有其他明显的罕见病指征。
Gripp曾阅读过描述Wiedemann-Steiner综合征患儿牙齿过早生长的病例报告。该疾病是由KMT2A基因突变引起的一种极为罕见的疾病。但Gripp并不确定。
于是,Gripp将这个女孩的照片上传到一个智能手机应用中,Wiedemann-Steiner综合征出现在该软件的提示中。
Gripp后来通过有针对性的DNA测试确定了女孩的病情。Gripp表示,人工智能方法帮助她缩小了疾病的潜在范围,并节省了昂贵的多基因面板测试的成本。
近日,研究人员在《自然—医学》上撰文描述了这种诊断辅助手段(一个叫做Face2Gene智能手机应用)的技术特点。
它依靠机器学习算法和类脑神经网络对先天性和神经发育障碍患者照片中的面部特征进行分类。利用从图片中推断出的“经验”,对可能的诊断进行定位,并提供可能的选项列表。
该研究负责人、马萨诸塞州波士顿数字健康公司FDNA首席技术官Yaron Gurovich告诉《中国科学报》,以标准化方式描述显型能力的增强,为未来的研究和应用,以及识别新的遗传综合征打开了大门。“它展示了如何将先进的算法,比如深度学习,应用到一个具有挑战性的领域。”
看“脸”识病
目前,人工智能蓬勃发展,甚至能“达到或超越人类表现”。在医疗健康领域,人工智能开始成为医生的“小助手”。
例如,各种遗传综合征会表现出独特的面部特征,然而,综合征数量巨大,要正确识别并非易事。利用人工智能或能帮助诊断遗传综合征。
但是早期此类人工智能研究采用的训练数据集规模不大,仅能识别少量综合征。而Face2Gene正是人工智能辅助诊断的再进一步。
FDNA研究人员首先训练了人工智能系统,以区分狄兰吉氏症候群和天使人综合征(这是两种面部特征截然不同的病症)与其他类似病症。他们还教会该模型对努南综合征的不同基因形式进行分类。
他们在算法中输入了涵盖216种不同综合征的17000多张确诊病例的图像。所有患者被确诊的遗传综合征总计达几百种。
研究人员利用两个独立的测试数据集测试人工智能的表现,每一个数据集都包含数百张之前经过临床专家分析的患者面部图像。对于每一张测试图像,Face2Gene按照一定顺序列出各种潜在的综合征。
在两组测试中,在约90%的情况下,Face2Gene提出的前10条建议中都包括了正确的综合征。当看到面孔新图像时,该应用程序的最佳诊断率约为65%。
“这是人们期待已久的医学遗传学领域突破。”Gripp说,“通过这项研究,我们已经证明,在临床工作中添加自动面部分析框架,如DeepGestalt,可以帮助实现更早地诊断和治疗,并改善生活质量。”
此外,澳大利亚和巴西联合研究团队于近日基于人工智能技术开发出一种图像处理算法,通过分析眼底相机拍摄的视网膜图像,可以瞬时自动识别出糖尿病视网膜病变的关键特征,即眼球内由于视网膜毛细血管破裂而渗漏出来的液体,准确率达98%。
“打败”专家
FDNA希望不断改善Face2Gene,以帮助其他公司在DNA分析过程中筛选、优先排序和解释未知基因变异等。但是为了训练它,FDNA需要大量数据。
Face2Gene目前对医疗专业人士是免费的。而且,许多医生已经开始将该系统作为诊断罕见遗传病的第二选择。它还可以为医生不知道如何判断病人症状的情况提供一个起点。“这就像谷歌搜索。”Gripp说。
随着越来越多的医疗保健专业人员将患者照片上传到应用程序,该应用的准确性略有提高。现在它的数据库中有大约150000张图像。
去年8月,Face2Gene和临床医生在出生缺陷研讨会上进行了一次非官方的“较量”。结果显示,该应用的表现优于人类。
南卡罗莱纳州格林伍德遗传中心遗传学家Charles Schwartz分发了10名儿童的面部照片,这些照片具有“相当可识别的”综合征特征,并要求与会者提出正确的诊断。
在49名参与研究的临床遗传学家中,只有一半人对两个病例选择正确。Face2Gene在其中7张图片上做出了正确的选择。
“我们惨遭失败,Face2Gene完胜。”马里兰州贝塞斯达美国国家人类基因组研究所的临床遗传学家Paul Kruszka说,“我认为每个儿科医生和遗传学家很快都会有这样的应用程序,并将像用听诊器一样使用它。”
“目前的挑战仍在于数据,如果有更多且更多样化的数据,我们就能够提供更好的结果。”Gurovich说。
存在风险
但是,该算法的好坏取决于它的训练数据集,而且存在风险,尤其是在那些只影响全球少数人的罕见疾病开始受到关注的情况下,该公司和研究人员将对数据集进行存储和商品化。
医生可以把这项技术当作一种辅助手段,尽管它并不能提供明确的诊断。但研究人员表示,这也引发了一些伦理和法律方面的担忧,例如培训数据集的种族偏见和数据库的商业碎片化。这两种情况都可能限制诊断工具的使用。
英国牛津大学计算生物学家Christoffer Nellaker表示:“这威胁到了这项技术的主要潜在好处。”Nellaker一直在推动该领域的数据共享。
一直以来,在训练数据集中的种族偏见都是一个问题。
2017年对智障儿童进行的一项研究发现,在比利时白人儿童中,Face2Gene对唐氏综合征的识别率为80%,而在刚果黑人儿童中这一比例仅为37%。
然而,随着训练数据集多样化,该算法对非洲面部识别的准确性得到改善,表明更公平地代表不同人群是可以实现的。
“正因为如此,我们成功地开发和培训了一种可以被认为是种族平等的人工智能解决方案。我们计划继续扩大和开发人工智能解决方案,帮助减少医疗保健领域的种族差异。”Gurovich告诉《中国科学报》,“随着我们向前发展,技术偏见会越来越少。”