原标题:三十年资深药企人Derek Lowe抨击AlphaFold:媒体夸大,靠结构预测做药「纯属自嗨」
DeepMind近日公布了AlphaFold的最新进展:已预测出超过100万个物种的2.14亿个蛋白质结构,几乎涵盖了地球上所有已知蛋白质,再次刷新了我们对它的期待。
(资料图片仅供参考)
AlphaFold 2横空出世时的热烈场景重现,再次在国内外的社交媒体上引发热议。但作为“圈内人”的生命科学领域研究者们,对AlphaFold此次公布的成果却褒贬不一。
在此前雷峰网《医健AI掘金志》发布的文章《预测2.14亿个蛋白质结构!AlphaFold 新成果再次引爆生命科学界,业内专家却褒贬不一》中,潘毅、周耀旗、许东等几位生物信息学领域的学者曾表示:AlphaFold蛋白质结构数据库此次更新的海量数据中存在着部分结果结构不稳定、不能应用于研究中等问题。
加拿大蒙特利尔大学MILA实验室唐建教授也向医健AI掘金志表示,AlphaFold预测出的蛋白质对药物研发的影响有限。
近期,美国一位制药行业的资深专家Derek Lowe博士发文,对外界尤其是媒体热捧的AlphaFold进行了一番吐槽。
Derek Lowe博士毕业于杜克大学,在大型制药公司工作了三十余年,从事治疗精神分裂症、阿尔茨海默氏症、糖尿病、骨质疏松症和其他疾病的药物发现项目。
Derek Lowe
上周,Derek Lowe在英国皇家化学学会(Royal Society of Chemistry)的网站上发布了一篇文章。
他旗帜鲜明地指出:AlphaFold不会带来药物研发领域的革新。
以下为Derek Lowe的文章,雷峰网做了不改变原意的整理。
长期以来,蛋白质结构预测一直被认为是计算生物学中最困难的问题之一。
但是在过去的一两年中,AlphaFold在这方面的工作上取得了显著的进步,预测出绝大部分人体蛋白质的组织结构。
如果放在十年前,这样的成果就像科幻故事一样。
我并不想否认AlphaFold取得的成果,但是一些新闻报道错误地理解了AlphaFold这一成果的意义。
我们并没有在理解“蛋白质为什么会这样折叠”方面取得巨大飞跃。
蛋白质结构通常情况下以线圈、环或片状的形态存在,但为什么不继续深入其中进行研究?
如果只在目前的层面上进行研究,将无法发现许多隐秘的答案。
我们早就拥有成千上万的新蛋白质结构预测结果,绝大部分是正确的。而且,尽管有一些例外,它们似乎确实大部分是正确的。
AlphaFold的算法在面对无序的蛋白质区域时会无法正常工作,AlphaFold的整个计算技术都建立在寻找已知结构的类比上,在没有可比较结构的情况下,AlphaFold也无计可施。
一部分无序的蛋白质在各种蛋白质的影响下能够进行有序排列,但也有一部分蛋白质在任何条件下都从未出现过有序的结构。
当蛋白质无法形成有序结构的时候,就超出了AlphaFold的计算能力。
AlphaFold提供了其结构预测的置信度。深蓝色结构的置信度更高,而黄色和橙色结构的置信度较低
需要强调的是,通过AlphaFold,我们得到的是蛋白质结构的预测,而非真正的蛋白质结构。
AlphaFold是很实用的蛋白质预测方法,但通过X射线、核磁共振或冷冻电镜等方式获取蛋白质的实际数据,才是确定其准确性的唯一方法。
但由于构象的灵活性,即使是实际数据也无法完全代表其准确性。
这正是媒体报道中夸大AlphaFold蛋白质结构数据库对药物研发影响的地方。
在小分子配体的存在下,蛋白质结构会发生变化和滑动,有时细微有时剧烈,但AlphaFold还无法预测这些变化。
也许最终能够找到这些问题的算法解决方案,但到目前为止,还没有足够多能够与小分子配体结合蛋白结构。我们需要的数量非常多。
有大约20种不同的蛋白质侧链需要考虑,但小分子结构的数量如此巨大,相比之下几乎是无限的。
还有一点,听起来很刺耳(尽管这是真的):在药物研发的过程中,对蛋白质结构的了解,鲜少影响研发进度。
因为研究者们通常在使用纯蛋白或活细胞进行检测的基础上运行项目。检测数据则代表着化合物是否符合研究者的要求,以及是否随着新化合物制造而表现更好。
蛋白质的结构可能会对研究者们下一步制造什么化合物有所启发,但也可能没有任何帮助。
归根结底,来自真实生物系统的真实数字才是最重要的。
随着药物研发项目的进行,这些数字涵盖了药代动力学、新陈代谢和毒理学的检测,这些都无法真正从蛋白质结构水平上处理。
激流之后往往才是最终的瀑布。
新药在最后的临床环节失败,往往是因为我们选择了错误的靶点或其他难以预料的原因。
而蛋白质结构预测对减轻这两种风险都无济于事,这就是药物研发的临床失败率高达85%的原因。
蛋白质结构预测的确是一个非常棘手的问题,但药物研发中面临的风险明显难度更甚。
Derek Lowe这篇文章发布后,也引发了两派读者的讨论。
支持他的读者认为,在研究中的确应该考虑到柔性蛋白质的影响,因为构象状态的变化需要逐案理解。蛋白质-蛋白质和蛋白质-核酸相互作用对了解该系统也很重要。结构本身无法解决所有问题,在取代实验数据之前,人工智能还有一段路要走。
也有读者不同意Derek Lowe的观点,认为“良好的结构预测将大大加快获取经验数据集的过程。”
一位读者表示,“基于结构的设计将是一个限制因素——在一个难以获得结构的环境中。在一个有 AlphaFold的世界中,情况不再如此。此外,可以再次运行AlphaFold,将一个小分子放入并重新折叠它周围的蛋白质。20年前,在我攻读博士学位期间,我们曾经使用sybyl 和autodock来做同样的事情——坦率地说,这些软件工具完全是垃圾。传统的药物设计就像盲人拄着拐杖一样颤颤巍巍,通过基于结构的设计,我们现在可以看到。它(AlphaFold)以前不是药物设计的重要组成部分,这一事实与未来如何发现新药无关。”
有读者认为,基于结构的药物设计活动大大有助于降低失败率。在AlphaFold缺乏实验结构的情况下与分子动力学模拟等其他计算方法相结合,远比传统方法要好得多。
不论国内还是国外,学者们对AlphaFold的评价均是褒贬不一,对其在药物研发中将产生的影响看法也不尽相同。
Derek Lowe的这篇文章,代表的是主流或者传统药企技术专家,面对新技术时一种“本能性”的抵触。
这种现象,和医学影像AI出现时,医生对AI的吐槽并无区别,本质上是两种专业背景的碰撞和对抗。但是,现在的放射科医生也逐渐接受了AI帮他们找肺结节。
得到这个问题的答案也很简单,从什么角度对AlphaFold所代表的深度学习技术进行价值评估?
AlphaFold能否为药物研发领域带来革新性的变化,你会站在哪一边?