脑震荡

首页 » 常识 » 诊断 » 用人工智能筛选氨基酸残基对底物的特异性,
TUhjnbcbe - 2023/4/14 8:20:00

编辑

萝卜皮

你不能期望,将制药科学家从实验室转移到厨房,还能获得同样的研究成果;但是,酶可以实现:它们的活性依赖于特定的环境。

改变酶的底物/辅因子特异性需要在底物袋周围空间相邻位置的多个突变。然而,当仅基于晶体结构信息时,这是具有挑战性的,因为酶在反应过程中会发生动态构象变化。

大阪大学的研究团队提出了一种通过使用逻辑回归进行系统发育分析,来估计每个氨基酸残基对底物特异性的贡献的方法。由于该方法可以通过排序估计突变的候选氨基酸,具有可读性,可用于蛋白质工程。研究表明,使用结构同源和功能不同的酶的氨基酸序列作为输入数据,可以获得高度准确和推理的机器学习模型。

该研究以「LogisticRegression-GuidedIdentificationofCofactorSpecificity-ContributingResiduesinEnzymewithSequenceDatasetsPartitionedbyCatalyticProperties」为题,于年9月2日发布在《ACSSyntheticBiology》。

自生命起源以来,具有不同结构和功能的蛋白质通过反复的突变和选择循环进化。尽管从基础科学到工业都使用了天然蛋白质,但预计蛋白质不会在宿主生物体或其生活环境之外使用。因此,通常需要通过提高它们的热稳定性、催化活性和底物/辅因子特异性转换来调整它们的功能以适应所需的环境条件。

可以通过人工累积影响其功能的突变来复制蛋白质的所需功能,这种方式类似于长时间在自然界中发生的方式。然而,将突变引入蛋白质会受到先前突变的影响;因此,每个突变都会对函数做出非线性贡献。尽管突变是必要的,但它们通常对功能和热稳定性不利,并且可能通过人工进化过程退出主要候选者。此外,一些功能是由所谓的符号上位性中不利突变的组合积累产生的,这使得蛋白质的人工进化更加困难。

以改变底物和辅助因子特异性为目的的人工设计特别具有挑战性。改变底物和辅助因子特异性通常需要引入多个突变,而远距离(10)突变会显著影响催化功能。此外,研究人员实际上只能筛选几千个突变体的样本,这只是基于活动的突变体选择所需的总搜索空间的一小部分。尽管在定向进化中反复利用饱和诱变提高了酶的活性和稳定性,但必须建立高通量筛选以获得所需的突变体。

计算酶设计可以克服以实验为导向的进化方法的局限性,因为进化轨迹不会限制设计过程。通过将量子化学计算产生的过渡态嵌入支架结构中,使用非天然底物产生逆醛醇反应。后来,催化Kemp消除和Diels-Alder反应的设计酶的开发表明,可以通过利用蛋白质支架的高可塑性来设计多种酶。尽管转换这些底物特异性的计算酶设计是有用的并且非常成功,但它们的使用受到限制,因为它们需要底物与残基的精确中间反应结构并导致低酶活性。

近期,机器学习(ML)被用于搜索巨大的空间并增加选择所需变体以支持定向进化程序的可能性。ML从独立于物理模型和潜在函数的数据中预测序列和函数之间的对应关系。一项使用ML线性模型的早期进化工程活动报告获得了卤代醇脱卤素酶突变体,该突变体可以将体积生产率提高约倍。

此外,用于处理实验数据不确定性的高斯过程回归已被用于改善细胞色素P的热稳定性、视紫红质的光学特性和荧光蛋白的修饰。这些模型是通过分析来自以下选择轮次的最初突变残基的蛋白质功能数据来制备的。然而,即使它可以构建一个高通量分析系统来评估酶的功能,实验预测的景观也会系统地偏离适应的动态,因为实验数据只会覆盖实际景观的一小部分。

此外,已知有助于底物特异性的氨基酸残基分布在整个结构中,而不仅仅是在底物袋周围,这使得功能决定氨基酸残基的鉴定更具挑战性。因此,确定那些有影响的残基的位置和数量是常规和ML辅助蛋白质进化的关键。

在此,大阪大学的研究团队提出了,一种通过将逻辑回归模型与具有相同折叠结构,但辅因子特异性不同的氨基酸序列数据集相结合,来识别参与辅因子特异性的氨基酸残基的方法。研究人员假设具有不同底物/辅因子特异性的结构同源酶之间的保守残基是可互换的,并且可能会改变它们的底物/辅因子特异性。利用逻辑回归模型,将可以获得与具有复杂特征但没有阐明晶体结构的酶相对应的氨基酸排名列表,并指定突变位置,这将允许优先突变设计并有效地限制搜索空间。

人工智能可以最大限度地减少反复试验,但仍然依赖于通过实验获得的酶晶体结构——这可能不可用或不是特别有用。因此,「应该在酶中发生突变的相关氨基酸可能只是最佳猜测。」共同作者TeppeiNiide说,「为了解决这个问题,我们设计了一种氨基酸排序方法,该方法仅取决于其他生物物种中广泛可用的类似酶的氨基酸序列。」

该研究通过将大肠杆菌苹果酸酶(ME)的辅助因子特异性从NADP依赖型改变为NAD依赖型,来检验这个假设。ME是一种酶,可将三羧酸循环中的中间体苹果酸脱羧为丙酮酸,这是糖酵解的最终产物,伴随着NAD或NADP。大多数生物,从原核生物到真核生物,都含有ME;因此,大量的序列数据可用于NAD和NADP依赖的ME。

通过获得来自不同物种的ME氨基酸序列,研究人员可获得负责辅因子特异性的残基。转换辅因子特异性的蛋白质工程主要是在代谢工程研究中开发的。然而,许多重新设计的酶只是混杂的修饰,对辅因子特异性转换的基本了解是不够的。

简而言之,该研究使用逻辑回归模型来识别每个位置的NAD和NADP依赖性背后的氨基酸。按照特征最显著差异的顺序替换氨基酸会导致辅助因子特异性转换。有趣的是,在开发的ML模型提出的数十个单元中引入突变并未对结构产生任何致命的负面影响。研究结果突出了将ML与系统发育分析相结合以进行酶促设计以改变辅因子特异性的潜力。

「通过使用人工智能,我们确定了苹果酸酶中意想不到的氨基酸残基,这些氨基酸残基对应于酶使用不同的氧化还原辅助因子。」共同作者HiroshiShimizu说,「这有助于我们了解酶的底物特异性机制,并将促进实验室中酶的优化工程。」

论文链接:

1
查看完整版本: 用人工智能筛选氨基酸残基对底物的特异性,