antiSMASH工具可以帮助研究人员找到负责生物合成有趣代谢物的细菌基因,如新的抗生素,杀虫剂和抗癌药物。收集antiSMASH工具结果的新数据库可以简化数千种细菌基因组在代谢物方面的比较。
“许多科学家寻找细菌代谢产物,因为他们寻找新的抗生素。在我们的小组中,我们寻找新的抗生素来对抗多重耐药细菌,如肺炎克雷伯菌或鲍曼不动杆菌。社会迫切需要新的抗生素来对抗这些导致严重败血症的细菌,小便感染和肺炎,“丹麦技术大学诺基亚诺德基金会生物可持续性研究中心(DTU)研究员兼科学软件工程师Kai Blin说。该数据库不仅适用于发现新的抗生素。食品和制药行业也使用这种工具,以确保用作例如益生菌的细菌不产生有毒化合物。该数据库的最新改进现已发表在核酸研究中。有趣的代谢物不直接参与微生物的正常生长,发育或繁殖。但代谢物通常在生物体对抗捕食者的防御系统中发挥重要作用。
在工业中,这些微生物代谢物可用作药物,调味剂和颜料。通常,微生物在实验室进行评估时不会自动产生有趣的代谢物,这使得有价值的化合物对科学家来说是“看不见的” - 除非他们看到DNA。“例如,如果您知道某种细菌产生代谢产物,但同时该生物体无法培养,因此进一步研究,您可以通过数据库在其他细菌中寻找相同的隐藏代谢物,”Kai Blin说。在过去的7年里,科学家们已经建立并改进了antiSMASH在线工具,现在它已经运行了超过100,000个任务。一年,有超过2500次引用。
但科学家发现,许多antiSMASH用户运行相同的基因组,寻找相同的结果。这对用户来说非常耗时,因为每次运行需要几个小时。因此,研究人员和软件工程师决定构建antiSMASH数据库,该数据库收集所有预先计算的结果。“这意味着用户可以立即获得结果,无需等待数小时或手动完成这项工作,这需要数天或数周,”Kai Blin说。有趣的代谢物由所谓的生物合成基因簇BGC编码,数据库经过培训可以识别。antiSMASH使用基于规则的聚类检测方法来识别45种不同类型的有趣代谢物。
最新版本的antiSMASH数据库包含6,200个完整的细菌基因组,与版本1相比增加了58%。此外,还添加了18,576个所谓的草案基因组。非常重要的是,更新还包含访问BGS的各种查询选项。软件工程师还为版本2添加了冗余过滤器,这意味着数据库仅显示来自最佳质量基因组的结果,而不是为具有几乎相同序列的数百个菌株提供结果。该数据库是开源的,免费且易于使用,即使对于非程序员也是如此。