人类基因组有自己的校对者和编辑者,他们的手工并不像曾经想象的那么杂乱。当DNA的双螺旋因暴露在X射线下而受损时,分子机器会进行遗传“自动修正”以将基因组恢复到一起——但这些修复通常是不完美的。就像你的智能手机可能会将拼写错误的短信修改成不连贯的短语一样,该单元的自然DNA修复过程可以以一种看似随机和不可预测的方式在断点处添加或删除DNA比特。使用CRISPR-Cas9编辑基因,使科学家能够破坏特定位置的DNA,但这可能会导致“拼写错误”,从而改变基因的功能。这种对CRISPR诱导的损伤的反应被称为“末端连接”,对禁用基因是有用的,但研究人员认为它太容易发展为治疗目的。
一项新的研究提出了这一观点。通过创建机器学习算法来预测人类和小鼠细胞将如何应对CRISPR诱导的DNA断裂,一组研究人员发现,细胞通常会以准确和可预测的方式修复断裂的基因,有时甚至会将突变的基因恢复到健康版本。此外,研究人员将这种预测能力用于测试,并成功纠正了患有两种罕见遗传疾病之一的患者的细胞突变。这项研究表明,细胞的基因自我校正有一天可以与基于CRISPR的疗法相结合,通过简单地精确切割DNA,让细胞自然愈合损伤,来校正基因突变。
发表在本周《自然》杂志上的这项研究由理查德梅尔、理查德梅尔金教授领导,他是梅尔金医疗保健转化技术研究所的主任,也是布罗德研究所的副教授。大卫吉福德,麻省理工学院计算机科学和生物工程教授;理查德舍伍德,布莱根女子医院遗传学系医学助理教授。“机器学习为人类疗法的发展提供了一个新的视角,”吉福德说。“这项研究是计算实验设计和分析与治疗目标相结合如何产生意想不到的治疗方法的一个例子。”
“目前,我们没有一种有效的方法来准确地纠正许多人类疾病的突变,”刘说。“通过机器学习,我们已经证明,通过简单地让细胞自我修复,我们通常可以预测地纠正这些突变。”许多疾病相关的突变涉及额外的或缺失的DNA,这被称为插入和缺失。研究人员试图通过基于CRISPR的基因编辑来纠正这些突变。为此,他们用酶切割双螺旋并插入缺失的DNA,或者用遗传物质模板作为蓝图,去除多余的DNA。但是,这种方法只适用于快速分裂的细胞,如血液干细胞。即便如此,它也只是部分有效,这使得它成为治疗体内大多数细胞类型的糟糕选择。为了在没有模板修复的情况下恢复基因功能,我们需要知道细胞是如何修复CRISPR诱导的DNA断裂的——这种知识直到现在才存在。
之前已经注意到CRISPR的修复结果模式的证据,吉福德的实验室开始认为这样的结果可以被预测到足以精确建模;然而,他们需要更多的数据来将这些模式转化为准确的预测理解。在麻省理工学院研究生Max Shen和布罗德研究所博士后Mandana Arbab的领导下,研究人员开发了一种策略,以观察细胞如何修复CRISPR在小鼠和人类基因组中靶向的2000个位点的库。在观察细胞如何修复这些切口后,他们将数据注入机器学习模型。在德尔福,算法被提示学习细胞如何对每个位点的切割作出反应——也就是说,细胞在每个受损基因的哪个DNA位置被添加或删除。他们发现,Delphi可以识别切割位点的模式,并预测校正基因中的插入和缺失。在很多地方,这组被修正的基因并不包含巨大的变异混合物,而是单一的结果,比如致病基因的修改。
事实上,在查询了德尔福通过切割适当位置可以纠正的疾病相关基因后,研究人员发现了近200种致病基因变异,这些变异在被CRISPR相关酶切割后大多被纠正为正常的健康形式。他们还可以纠正患有两种罕见遗传疾病的患者的细胞突变,这两种疾病是赫尔曼斯基-普德拉克综合征和门克斯病。“我们证明了主要用作大锤的同一种CRISPR酶也可以用作凿子,”舍伍德说。“在你做这个实验之前,能够知道你的实验最可能的结果,对于许多使用CRISPR的研究人员来说,是一个真正的进步。”
吉福德说:“我们曾希望能够将疾病相关基因修复成天然形式,看到我们的假设是正确的,这非常有益。”InDelphi可在该网站上获得,该网站允许世界各地的学术研究人员设计指导性RNA,以进行精确编辑。对修复致病突变感兴趣的科学家可以去网站上看看,在哪里可以切割DNA,得到想要的结果。此外,科学家还可以利用该网站确认旨在关闭基因的DNA切割的效率,或者确定模板驱动修复的最终连接副产物。在这种方法可以用于纠正临床突变之前,还需要做更多的工作。如果预测的结果导致一些有用的东西,无论是出于研究还是治疗目的,这项研究表明,触发细胞的自然“自我校正”可能是一种有效的基因组编辑方法。