蛋白质的紊乱对于生物功能至关重要,蛋白质的结构紊乱比你想象的更为普遍。具有无序区域的蛋白质也可以是粘性的,并且在细胞内部和细胞之间聚集在一起,并且直接涉及许多神经退行性疾病。因此,能够鉴定蛋白质中的无序区域是非常重要的。
不幸的是,在实验上表征多肽的结构倾向是具有挑战性和耗时的,因此用于从序列预测蛋白质病症的生物信息学方法是必不可少的。
因此,近年来许多生物信息学家已经构建了用于区分肽序列的算法,这些肽序列将从那些不能折叠的肽序列中分离出来,并且这些算法可以基于来自物理化学参数(如氨基酸的电荷或疏水性)的各种“特征”。看着进化相关性。
现在许多这样的预测程序已经可用,有一些基准来验证和测试预测是显而易见的。为了解决这一困境,Nielsen和Mulder使用保存的NMR化学位移数据生成并验证了一个代表性的实验性基准测试集,其中包括一百多种选定的蛋白质。然后他们分析了26种广泛使用的疾病预测方法的表现,发现这些方法有明显不同。
在他们的研究中进行的彻底比较将帮助全球的蛋白质科学家更好地了解哪些程序最适合使用。