融合結(jié)構(gòu)知識的蛋白質(zhì)預訓練模型進展
物理學報
頁數(shù): 15 2024-08-12
摘要: 自然語言和圖像處理領(lǐng)域引發(fā)的人工智能革命給蛋白質(zhì)計算領(lǐng)域帶來了新的思路和研究范式.其中一個重大的進展是從海量蛋白質(zhì)序列通過自監(jiān)督學習得到預訓練的蛋白質(zhì)語言模型.這類預訓練模型編碼了蛋白質(zhì)的序列、進化、結(jié)構(gòu)乃至功能等多種信息,可方便地遷移至多種下游任務,并展現(xiàn)了強大的泛化能力.在此基礎(chǔ)上,人們正進一步發(fā)展融合更多種類數(shù)據(jù)的多模態(tài)預訓練模型.考慮到蛋白質(zhì)結(jié)構(gòu)是決定其功能的主要因素,...