首页 >> 无人驾驶 >

受数独启发研究人员创建了用于药物发现的新型蛋白质折叠算法

2022-06-01 14:00:00 来源: 用户: 

多伦多大学唐纳利细胞与生物分子研究中心的计算生物学家已经开发出一种人工智能算法,该算法有可能产生新的蛋白质分子作为精细调整的疗法。T的Temerty医学院的分子遗传学教授和文理学院的计算机科学教授Philip M. Kim领导的团队 开发了ProteinSolver,这是一种图形神经网络,可以设计一种全新的蛋白质来适合给定的几何形状。研究人员从数字难题数独中汲取了灵感,其概念在概念上类似于蛋白质分子。

解决数独的策略可以产生折叠成预定几何结构的新颖蛋白质序列。图片来源:多伦多大学Alexey Strokach

他们的发现 发表在《细胞系统》杂志上 。

Kim说:“当您将蛋白质分子描述为网络时,与Sudoku的相似之处就显而易见了。”他补充说,以图形形式描绘蛋白质是计算生物学的标准做法。

新合成的蛋白质是一串氨基酸,根据该蛋白质的基因代码中的说明将其缝合在一起。然后,氨基酸聚合物会自身折叠并折叠成一个三维分子机器,可用于医学领域。

转换成图的蛋白质看起来像节点网络,代表由边缘连接的氨基酸,这些氨基酸是分子之间的距离。通过应用图论原理,可以为特定目的建模分子的几何形状,例如中和入侵的病毒或关闭癌症中的过度活跃受体。

蛋白质具有良好的药物作用,这是由于其表面具有三维特征,与具有广谱光谱并可能导致有害副作用的合成小分子药物相比,它们可以更精确地与细胞靶标结合。

金说,过去几年批准的所有药物中,蛋白质中仅略超过三分之一,蛋白质也构成了全球十大药物中的绝大多数。胰岛素,抗体和生长因子只是已经使用的可注射细胞蛋白(也称为生物制剂)的几个例子。

然而,由于存在大量可能的结构可供选择,从头设计蛋白质仍然非常困难。

Kim说:“蛋白质设计的主要问题是搜索空间很大。”他指的是将20种天然氨基酸结合成蛋白质结构的多种方式。

他说:“对于100个氨基酸的标准长度蛋白质,在100种可能的分子结构中,有20种具有强大的功能-这比宇宙中分子的数量还多。”

金决定通过从三维结构开始并计算其氨基酸组成来扭转这个问题。

“这是蛋白质设计,或者是蛋白质折叠的逆向问题:您想着一个形状,想要一个可以折叠成该形状的(氨基酸序列)。解决该问题在某些方面比蛋白质折叠更有用,因为理论上您可以出于任何目的生成新蛋白质。” Kim说。

这时候, 阿列克谢Strokach,博士生在金正日的实验室,了解其相关性分子几何类后转向数独。

在Sudoku中,目标是通过观察一组规则和现有数字值,在稀疏填充的网格中查找缺失值。

蛋白质分子中的单个氨基酸也受到其邻居的类似限制。局部静电力确保带有相反电荷的氨基酸紧密堆积在一起,而带有相同电荷的氨基酸则被拉开。

Strokach首先将Sudoku中发现的约束构建到神经网络算法中。然后,他在庞大的可用蛋白质结构及其氨基酸序列数据库中训练了算法。目的是要教算法,ProteinSolver,该规则-经过数百万年的进化而磨练-控制将氨基酸包装成较小折叠的规则。将这些规则应用于工程过程应增加最终拥有功能蛋白的机会。

然后,研究人员通过给ProteinSolver提供现有的蛋白质折叠并要求其生成可以构建它们的氨基酸序列,对它们进行了测试。然后,他们采用了自然界中不存在的新颖计算序列,并在实验室中制造了相应的蛋白质变体。这些变体折叠成预期的结构,表明该方法有效。

以目前的形式,ProteinSolver能够为已知几何上稳定的任何蛋白质折叠计算新颖的氨基酸序列。但是最终目的是设计具有全新生物学功能的新型蛋白质结构,例如作为新疗法。

Strokach说:“最终目标是使某人能够手工绘制一个全新的蛋白质并为此计算序列,这就是我们现在正在研究的内容。”

研究人员将ProteinSolver及其背后的代码开源,并通过用户友好的网站提供给更广泛的研究社区。

  免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!

 
分享:
最新文章