模型了解单个氨基酸如何决定蛋白质功能
麻省理工学院研究人员的机器学习模型通过计算分解了氨基酸链段决定蛋白质功能的方式,这可以帮助研究人员设计和测试用于药物开发或生物学研究的新蛋白质。蛋白质是氨基酸的线性链,通过肽键连接,折叠成极其复杂的三维结构,具体取决于链中的序列和物理相互作用。该结构反过来决定了蛋白质的生物学功能。因此,了解蛋白质的3-D结构对于例如预测蛋白质对某些药物的反应非常有价值。
但是,尽管经过数十年的研究和多种成像技术的发展,我们只知道可能的蛋白质结构的一小部分-数以百万计的数以万计。研究人员开始使用机器学习模型根据其氨基酸序列预测蛋白质结构,这可能有助于发现新的蛋白质结构。但这是具有挑战性的,因为各种氨基酸序列可以形成非常相似的结构。而且,训练模型的结构并不多。
麻省理工学院研究人员开发的新模型创建了更丰富,更易于计算的表示形式,用于表示单个氨基酸如何确定蛋白质的功能,可用于设计和测试新蛋白质。学分:麻省理工学院
在2019年5月的国际学习表示会议上发表的一篇论文中,麻省理工学院的研究人员开发了一种方法,用于``学习''蛋白质序列中每个氨基酸位置的易计算表示,最初使用3-D蛋白质结构作为训练指南。然后,研究人员可以将这些表示形式用作输入,以帮助机器学习模型预测单个氨基酸片段的功能-不再需要有关蛋白质结构的任何数据。
将来,该模型可通过为研究人员提供更好的零位插入和修改特定氨基酸区段的机会,而用于改进的蛋白质工程。该模型甚至可能使研究人员完全远离蛋白质结构预测。
“我想边缘化结构,”计算机科学与人工智能实验室(CSAIL)计算与生物学小组的研究生Tristan Bepler说。“我们想知道蛋白质在做什么,而了解结构对此很重要。但是,仅根据氨基酸序列,我们可以预测蛋白质的功能吗?其动机是摆脱专门预测的结构,转向[寻找]氨基酸序列与功能的关系。”
加入Bepler的作者之一是MIT的西蒙斯数学教授Bonnie Berger,他是电气工程和计算机科学系的联合教职,并且是计算和生物小组的负责人。
从结构中学习
研究人员不是像传统模型那样直接预测结构,而是直接将预测的蛋白质结构信息编码为表示形式。为此,当模型学习特定氨基酸的功能时,他们使用已知的蛋白质结构相似性来监督其模型。
他们通过蛋白质结构分类(SCOP)数据库中的大约22,000种蛋白质对模型进行了训练,该数据库包含成千上万种蛋白质,这些蛋白质通过结构和氨基酸序列的相似性进行分类。他们为每对蛋白质计算了一个真实的相似度评分,这意味着它们基于SCOP类在结构上有多接近。
然后,研究人员给他们的模型提供了随机的蛋白质结构对和氨基酸序列,并通过编码器将其转换为称为嵌入的数字表示。在自然语言处理中,嵌入本质上是以与句子中的字母或单词相对应的方式组合的数百个表。两个嵌入越相似,字母或单词在句子中一起出现的可能性就越大。
在研究人员的工作中,该对中的每个嵌入都包含有关每个氨基酸序列与另一个氨基酸序列有多相似的信息。该模型将两个嵌入对齐,并计算相似度得分,然后预测其3-D结构的相似度。然后,该模型将其结构的预测相似性得分与实际SCOP相似性得分进行比较,然后将反馈信号发送至编码器。
同时,该模型为每次嵌入预测了一个“接触图”,该图基本上表明了每个氨基酸与蛋白质预测的3-D结构中的所有其他氨基酸有多远-本质上,它们是否接触?该模型还将其预测的接触图与SCOP中的已知接触图进行比较,并将反馈信号发送到编码器。这有助于模型更好地了解氨基酸在蛋白质结构中的确切位置,从而进一步更新每种氨基酸的功能。
基本上,研究人员通过要求其预测配对序列嵌入物是否会共享相似的SCOP蛋白结构来训练他们的模型。如果模型的预测分数接近真实分数,则表明它在正确的轨道上。如果没有,它将进行调整。
蛋白质设计
最后,对于一个输入的氨基酸链,模型将为3-D结构中的每个氨基酸位置生成一个数值表示或嵌入。然后,机器学习模型可以使用这些序列嵌入,根据预测的3-D结构“上下文”(其位置和与其他氨基酸的接触)来准确预测每种氨基酸的功能。
例如,研究人员使用该模型来预测哪些片段(如果有的话)穿过细胞膜。仅给出一个氨基酸序列,研究人员的模型就可以比现有模型更准确地预测所有跨膜和非跨膜片段。
斯坦福大学计算机科学教授Serafim Batzoglou说:“ Bepler和Berger的工作在代表蛋白质序列的局部结构特性方面取得了重大进展。” “表示是使用最新的深度学习方法来学习的,该方法在RaptorX和AlphaFold等系统的蛋白质结构预测中取得了长足进步。这项工作在人类健康和药物基因组学中具有最终应用,因为它有助于检测破坏蛋白质结构的有害突变。”
接下来,研究人员旨在将该模型应用于更多的预测任务,例如弄清楚哪些序列片段与小分子结合,这对药物开发至关重要。他们还致力于使用该模型进行蛋白质设计。他们使用序列嵌入,可以预测蛋白质将在哪种颜色波长下发出荧光。
“我们的模型使我们能够将信息从已知的蛋白质结构转移到结构未知的序列。使用我们的嵌入作为特征,我们可以更好地预测功能并实现更有效的数据驱动的蛋白质设计。” Bepler说。“从总体上讲,这种蛋白质工程就是目标。”
Berger补充说:“因此,我们的机器学习模型使我们能够从相对较少的已知结构中学习蛋白质折叠的“语言”,这是原始的“圣杯”问题之一。”
免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!
-
合创汽车试驾预约,快速通道开启豪华体验。即刻预约,享受专属试驾服务,感受智能科技与极致设计的完美融合。...浏览全文>>
-
零跑C16试驾全攻略:零跑C16是一款集智能、空间与性价比于一身的中型SUV。试驾前建议关注其智能座舱系统,支持...浏览全文>>
-
万象汽车试驾,轻松搞定试驾。只需几步,即可预约专属试驾体验。登录官网或APP,选择心仪车型,填写基本信息,...浏览全文>>
-
试驾极氪001前,新手需做好以下准备:首先,提前预约试驾时间,了解车型配置与功能;其次,检查驾驶证、身份证...浏览全文>>
-
职业教育的传承与价值,需在时代发展的逻辑中发展,在技术进步的潮流中进步。二十载的光阴更迭,坚守是优路教...浏览全文>>
-
试驾五菱凯捷可以通过以下几种常见途径进行:1 到店预约试驾 消费者可以前往当地的五菱4S店或授权经销商,...浏览全文>>
-
大力牛魔王试驾全攻略试驾一款新车,尤其是像“大力牛魔王”这样充满科技感的电动车型,需要提前做好充分准备...浏览全文>>
-
想要快速锁定北汽雷驰的试驾名额,您可以采取以下步骤:首先,提前了解北汽雷驰的试驾活动安排。通常品牌会在...浏览全文>>
-
试驾零跑汽车零跑C01,感受其带来的豪华驾乘与卓越性能。这款车型以科技感和舒适性为核心卖点,为用户带来全新...浏览全文>>
-
试驾小鹏P7+是一次令人愉悦的体验,从踏入4S店的那一刻起,就感受到无微不至的服务。工作人员热情迎接,并详细...浏览全文>>
- 合创汽车试驾预约,快速通道开启豪华体验
- 北汽雷驰试驾预约如何快速锁定试驾名额?
- 坦克试驾,开启完美驾驭之旅
- 零跑汽车试驾,如何在4S店快速预约?
- 昌河北斗星X5试驾,简单几步,开启完美试驾之旅
- 大众预约试驾如何快速锁定试驾名额?
- 试驾奔驰迈巴赫S级预约流程
- 极氪007试驾预约预约流程
- 试驾极氪009怎么预约
- 试驾深蓝S05的流程是什么
- 极狐 阿尔法S(ARCFOX αS)试驾,从咨询到试驾的完整体验
- 奔驰预约试驾,轻松几步,畅享豪华驾乘
- 奇瑞新能源试驾,体验极致驾驶乐趣
- 试驾本田雅阁,轻松搞定试驾流程
- Polestar极星试驾,从咨询到试驾的完整体验
- 北汽雷驰预约试驾需要哪些条件
- 捷途旅行者预约试驾,开启完美驾驭之旅
- 荣威预约试驾全攻略
- 山西二本综合院校排名及分数线一览表
- 300分能上的公办专科大学排名一览表