计算机可以预测小分子蛋白的详细结构,几乎和实验方法,至少在某些时候,根据新的研究的霍华德休斯医学研究所的研究人员。
结果,这是在“科学”杂志报道,提供了一丝希望,科学家最终可能能够确定其基因组序列的蛋白质的结构,一个似乎难以逾越的问题。
资深作家,霍华德休斯医学研究所研究员大卫贝克说:“对于超过40年的时间里,人们都知道的一种蛋白质的氨基酸序列指定其三维结构,但一直无人能转化为一个精确的结构序列,” 华盛顿大学 。 “这项研究是令人兴奋的原因是,我们显示从序列预测结构的进展。,这不是问题就解决了,但有希望。”
蛋白质是生物机器,科学家需要,以确定其结构,以了解蛋白质是如何工作的。现在,科学家们确定的结构完全由蛋白质的原子特征在实验室中测量。相比之下,“在这种情况下,我们从来没有碰过的试管中,”贝克说。 “我们给它一台计算机,并说,”走出去“。”
在这项研究中,一个复杂的计算机程序折成10万个可能的变化,17个氨基酸的短串。当研究人员比较了此前其他科学家利用实验技术解决实际结构最好的预测,他们有相同的成功率,棒球大联盟的最佳击球手。
“我们实现了我们的小分子蛋白的基准设置约三分之一几乎原子分辨率结构预测说,”第一作者,在贝克实验室的博士后研究员菲利普布拉德利。 “这是一个真正的一步,实现结构,在某种程度上是可比你可以通过实验。”
令人鼓舞的成果,从一个复杂的计算机建模称为Rosetta的程序细化先到先得,前几年的发展,在贝克的实验室。该计划的前提下,蛋白质的最低能量状态的崩溃,像下山滚动的球,直到它在平地上休息。成千上万可能的形状,由计算机生成的能量计算,并选定预测的最低能量形状。
布拉德利说,预测过程发生在两个步骤。第一阶段采用近似模型,这使得能源的快速计算,因此可以迅速进行,而第二个使用了非常详细的模型,能量计算需要更长的时间,但更加精确。开展一个大规模搜索,通过可能的结构是在第一阶段,和有前途的位置,然后在第二阶段详细探讨。
第一阶段的事实,所有的氨基酸有相同的部分,从而形成蛋白质骨干优势。计算机增加了一个凸出其独特的身份,让每个氨基酸的侧链的模糊画面。侧链的序列,最终使每一个蛋白质,其形状特征的环境和邻居,他们更喜欢。
然后计算机随机曲折,循环,并弯曲成10万的基础上,氨基酸的首选地点的不同形状的每个氨基酸序列。某些氨基酸往往走向蛋白表面的水样的世界潜水,而其他的蛋白质内盖。计算机也占了20个氨基酸的社会风尚;有的要接近对方,别人喜欢他们的距离。
在第二阶段,罗塞塔取代详细的,与所有的代表原子物理现实模型的侧链的模糊画面。计算机从侧链和蛋白质骨干原子的位置,然后使用了详细的物理化学基础力场,这有利于接近原子和氢键的包装,更准确地计算结构的能量。
“什么是分子的包装似乎是关键,”贝克说。 “蛋白质结合在一起的完美的中间没有孔,并在彼此的顶部没有原子,这是一样密密麻麻的,因为它可以,它就像一个三维拼图的。”
研究人员调升50来自其他基因组,如鼠标或飞,的蛋白质同源的重复过程分为两个步骤,找到正确的匹配的可能性。该协议是一个盲目的年度预测被认为是消除偏见从蛋白质结构预测模型的最高标准的测试第一次测试。
“我们不能完全计算的能量,但最大的问题是通过搜索可能的形状,”贝克说。 “我们在那里没有得到正确的答案在计算机上,它几乎总是实际结构的最低能量,所以我们会成功,如果我们探讨了这部分的空间的情况下。”