澎湃新闻记者 贺梨萍

在科学面临历史性机遇的今天,人工智能和传统科研结合带来的巨大潜能使“AI for Science ”成为当前的重要趋势。近日,未来论坛科学讲座《理解未来》即聚焦“AI+生命科学”,来自人工智能、计算机领域以及蛋白质结构预测、分子力学等生命科学领域的科学家共话前沿科学突破。该场讲座由未来论坛理事、北京大学李兆基讲席教授谢晓亮领衔策划。

中国工程院院士、鹏城实验室主任、北京大学博雅讲席教授高文围绕云脑II:AI for Science智能算力,以及鹏城·扁鹊大模型等最新科研成果进行分享。高文介绍,为了让AI为科学问题服务,首先要打造先进自主的云态智能算力平台,支持大规模开源、开放和模型共享。

他指出,鹏城云脑II已建设成为首个国产自主的E级AI算力平台,并形成了自主AI基础软件栈、AI算法流水线,高性能并行计算等一系列支撑架构。云脑的超大规模模型训练平台现已赋能全球首个2千亿参数中文预训练语言模型-鹏程·盘古、多对多模式的多语言机器翻译模型-鹏程·丝路、视觉与跨模态的模型-鹏程·大圣,与百度联合开发的增强知识模型-鹏城百度·文心等多项引擎。

而在AI赋能生命健康领域,鹏城实验室正在开展建设的鹏城·扁鹊大模型通过依托鹏城云脑大装置构建横跨基因和表型的多模态知识图谱、预训练模型和高精度生理生化仿真模型等,通过对人体生命组学大数据进行数据感知融合分析建模,最终服务生命健康领域的基础研究和推动健康医疗。

美国芝加哥丰田计算技术研究所教授、北京大学客座教授许锦波则分享了通过使用人工智能,颠覆蛋白质结构预测,改变分子生物学研究范式的突破。

许锦波介绍,2016年,其团队开发的深度卷积残差网络,大幅度提高残基或原子相互作用预测的准确度。随后的2020年,谷歌旗下人工智能公司DeepMind则开发了基于注意力机制的神经网络。

“通过使用人工智能,我们颠覆了蛋白质结构预测,甚至改变了很多分子生物学家的研究范式,很多人开始使用预测的结构去分析蛋白质功能。”许锦波也指出,目前该领域还面临一些未解决的问题,比如当一个家族里只有一个孤儿蛋白的时候,还有蛋白质的复合物,现有方法准确度还不太理想。“我们希望准确预测蛋白质在某种特定条件下的结构,和多肽、核酸的相互作用,以及预测突变对蛋白质结构功能的影响。”

此外,在前瞻对话环节,高文指出,AI在未来十年的生命科学发展当中,将大有用武之地。例如:人类对于基因组学的分析,哪些片段具有哪些功能?哪些片段的突变会为人类健康带来怎样的影响?只要获取到足够多的数据,我们就可以通过AI来进行计算、分析,并给出药物、饮食方面的建议,降低或延缓人类的患病速度,提高人们的生活的质量。

高文还表示,在小分子药物设计领域,AI也将发挥关键作用。以往,药物成分大多从自然界中提取,而有了AI的赋能,蛋白质结构和功能得以高效测定,我们可以针对某些蛋白对症治疗,并通过生成或设计蛋白质结构制作药物。预计,通过AI算法以及数据模型的不断演进,该领域十年内就会实现突破。

谈到AI+生命科学的产业应用价值,许锦波表示,目前“AI for Science”的产业化环境很好,特别是“AI for BioTech”。国家在“AI for BioTech”领域非常重视,投资机构也非常支持硬科技领域的早期、长期投资。而从产业角度来讲,由于AI在生物制药领域为各个环节赋能,帮助行业提升了效率与准确度,因此AI在该领域的产业化也具有很好的前景。

推荐内容