人工智能(AI)因其強大的建模復雜非線性關系的能力,正在重塑化學研究,尤其在生物化學、有機化學和無機化學等領域,已取得了重大的突破。然而,在高分子科學中,這一浪潮卻未能充分釋放潛力。為什么?一方面,相較于其他領域,高分子科學所積累的數據通常極為稀缺且碎片化,這對構建具有泛化能力的模型提出了嚴峻挑戰。另一方面,高分子本身結構復雜,具有長鏈與周期性等特征,而在現有的AI建模中,往往被簡化為單一重復單元,采用類似小分子的處理方式。這種簡化忽略了其結構本質,導致模型難以真正“理解”高分子,限制了實際應用效果。此外,高分子材料的性質不僅取決于其重復單元的化學結構,還與分子量及其分布、交聯程度、共聚方式,甚至加工條件等因素密切相關。因此,要想讓AI真正服務于高分子材料設計,迫切需要一個統一的表示學習框架,能夠顯式建模其長程結構,并靈活地整合額外信息,以適應多樣化的下游任務。
為此,浙江大學高分子科學與工程學系計劍教授、張鵬研究員團隊開發了一種周期性感知的高分子深度學習框架(PerioGT),用于高分子的表征學習與性質預測。該模型通過結構感知的自監督預訓練,在海量無標簽數據中學習高分子的結構先驗,并在16個高分子性質預測任務中全面超越現有的AI模型。值得一提的是,PerioGT 采用了模塊化圖構建策略,具備良好的可擴展性,適用于各類高分子材料體系。同時,作者還通過一個真實案例對其在材料篩選中的實際效能進行了驗證。
2025年11月20日,相關成果以“Periodicity-aware deep learning for polymers”為題發表于《Nature Computational Science》,吳宇暉博士研究生為論文第一作者。
首先,研究團隊引入了一種化學知識驅動的周期性先驗。具體做法是,在高分子主鏈上設置固定大小的采樣窗口,通過滑動提取多個結構片段。來自同一高分子的不同片段被視為正樣本對,不同高分子的片段則作為負樣本對,并在片段中隨機掩蓋部分原子。在此基礎上,研究者構建了對比學習任務,顯式引導模型識別語義上相似的結構片段,從而更準確地捕捉高分子的長程周期性規律。同時,模型還學習如何根據上下文重建被掩蓋的原子信息,增強其對局部結構的理解能力。基于這一思路,作者在100萬個虛擬高分子結構上進行了大規模自監督預訓練,使模型能夠全面學習高分子的通用結構特征。同時,為了構建一個靈活、統一的框架,作者還提出了一種模塊化的圖構建策略(PolymerGraph),通過虛擬節點的形式引入額外的全局/局部信息,從而促進關系建模,靈活地適應各類高分子材料體系(包括各類共聚物)。此外,團隊還提出了一種周期性增強的提示調優策略(PGFT),將不同片段中的等價信息融合,使模型在微調時能更好地利用預訓練中學到的知識。

圖1 模型概況。a, 預訓練過程。b, 基于周期性增強的對比學習。c, 模塊化的PolymerGraph構建策略。d, 周期性增強的提示調優。
隨后,研究團隊系統評估了模型在10個均聚物性質預測任務中的表現,涵蓋了高分子材料中的一系列關鍵性能指標。結果顯示,PerioGT在所有任務上均顯著優于現有模型。進一步地,研究者將模型應用于6個更具挑戰性的共聚物預測任務,在結構更復雜、變量更豐富的場景下,PerioGT 依然展現出最佳性能。上述結果表明,作者提出的周期性感知的預訓練策略不僅有效引導模型學習高分子豐富的結構特征,且具備跨體系、跨任務的廣泛適用性。


為了進一步驗證模型對高分子周期性結構的感知能力,研究團隊對模型生成的嵌入向量進行了相似性分析(圖2)。結果顯示,PerioGT 能夠準確識別出高分子中的周期性結構模式,而傳統方法則未能展現出明顯規律,表明 PerioGT 對結構周期性的建模更為精準。進一步地,作者通過展示四組具體實例(圖3),更直觀地印證了 PerioGT 在捕捉周期性信息方面的優勢。

圖2 PA-level相似性分析。

圖3 Instance-level相似性分析。
為進一步理解PerioGT優越性能背后的原因,研究團隊對模型的潛在表示空間進行了深入分析。他們從三個維度展開評估:屬性對齊、結構對齊與分布均勻性。結果顯示,PerioGT的潛在空間不僅捕捉到了玻璃化轉變溫度(Tg)、熔點(Tm)等高分子的關鍵物化性質,還能有效區分結構相似的高分子類型,體現出對結構的強大表征能力。同時,模型生成的嵌入分布更加均勻,有助于保留更豐富的信息。這些結果表明,PerioGT在自督學習中成功提取了高分子的深層結構與性質規律,為多種下游任務提供了堅實的表征基礎。

圖4 潛在空間分析。a,b, 屬性對齊性可視化分析。c, 結構對齊性可視化分析。d, 均勻性可視化分析。
最后,為了驗證PerioGT在真實世界中的有效性,研究團隊開展了一個關于抗菌聚合物發現的案例研究。作者通過Michael加成反應構建了一個虛擬高分子庫,并從中合成了一部分樣本進行實驗標注。微調后,PerioGT 展現出優于其他模型的預測準確性。研究人員進一步篩選出模型預測排名前30的候選分子并實際合成測試,結果有高達 83%(25/30)的高分子在體外表現出良好的抗菌活性,遠超其他自監督學習模型(57%和20%)。其中兩種代表性高分子對耐甲氧西林金黃色葡萄球菌展現出強效抑菌能力(MIC = 8 μg/mL)。

擴展圖1 案例研究:抗菌高分子。a, 基于Michael加成的高分子庫。b, Top-30實驗結果。c, 篩選到的兩種抗菌高分子。d, 活死染色結果。e-f, 機制探究。
綜上所述,該研究表明,將高分子中普遍存在的周期性先驗引入建模過程,結合模塊化的圖構建策略,有助于顯著提升模型表征的泛化能力和適用性。作為一種自監督學習框架,PerioGT能夠充分利用海量無標簽數據,有效捕捉高分子體系中的關鍵結構語義,從而減輕對大規模標注數據的依賴,為高分子科學領域提供了一種通用且高效的建模范式。
原文鏈接:https://www.nature.com/articles/s43588-025-00903-9
- 港城大Steven Wang教授、過程工程所楊超研究員、帝國理工Matar教授 Nat. Sustain.:“液滴拖把” - 揭示水滴驅動超重顆粒脫附機制 2026-04-02
- 華南理工劉偉峰 AIChE J.:一步法構筑長支鏈聚烯烴彈性體及動力學機理 2026-03-26
- 首屆中國“AI+新材料”大會 - “AI+高分子材料”分論壇 投稿三天倒計時 2026-03-25
- 天津大學宋東坡教授課題組 Adv. Mater.: 無視角依賴、高飽和度植物油基高分子結構色顏料 2025-03-06
- 清華大學李琦課題組《Nat. Commun.》: 高分子結構單元定制組裝策略實現250℃極耐溫介電儲能 2023-04-28
- 都柏林大學/安徽理工大學王文新教授團隊 Angew綜述:多乙烯基單體自由基聚合的模擬發展 2022-11-30
- 杭師大黃又舉教授團隊 ACS Nano:自驅動自報告型金屬酶納米平臺實現硫化氫介導銅死亡的實時監測與精準干預 2026-03-22