【资料图】
科技日报记者 张梦然
加拿大多伦多大学研究人员开发了一种人工智能系统,可以使用生成扩散来创建自然界中不存在的蛋白质。该系统有望使治疗蛋白的设计和测试更加高效和灵活,从而加速人类药物开发。研究发表在最新一期《自然·计算科学》杂志上。
蛋白质由氨基酸链组成,氨基酸链折叠成的三维形状反过来又决定了蛋白质的功能。这些折叠的三维形状经过数十亿年的发展,多种多样且复杂,但数量是有限的。因此研究人员开始尝试设计非自然界产生的折叠模式。
这一研究的主要难题是对折叠的“想象”,因为很难预测哪种折叠是真实的,并在蛋白质结构中起作用。通过将基于生物物理学的蛋白质结构表示与图像生成空间的扩散方法相结合,科学家找到了解决这个问题的途径,创建了被称为ProteinSGM的新系统。
该模型从图像表示(图像信息在计算机中的表示和存储方式)中学习,并以非常高的速度生成全新的蛋白质。研究人员表示,除了优化图像生成过程存在挑战外,对系统产生的蛋白质进行验证也很困难,因为该系统产生的许多结构与自然界中发现的任何结构都不同。
根据指标,几乎所有产生的结构看起来都合理,但研究人员需要进一步的证据。他们转向求助于人工智能“欧米伽折叠”(深度思维公司“阿尔法折叠2”的改进版本),测试后确认,几乎所有的新序列都折叠成了所需的新蛋白质结构。再辅以实验室的物理测试,研究人员最终确信这些都是正确的蛋白质折叠。