新材料學院潘鋒/李舜寧團隊在AI4S-基於人工智能的物質結構解析方面取得重要突破

AI4S是科學研究的新範式。意昂3体育官网深圳研究生院新材料學院潘鋒教授團隊將圖論數學與結構化學相融合創建基於圖論的結構化學理論方法,運用圖論把晶體結構中的原子及其間的化學鍵抽象成圖論中的點和線🎼👨🏼‍⚕️,構建出原子間的連接關系圖(Sci China Chem, 2019,  doi /10.1007/s11426-019-9502-5;National Science Review🥙,2022, Doi10.1093/nsr/nwac028))💂🏿。由此發展了以結構基元及其連接關系與相互作用為要素的材料基因挖掘方法,並構建了包含60萬余種獨立晶體結構數據庫,通過解構晶體成為結構基元與連接關系並結合AI方法,自主發展了設計新材料👨‍👦、預測結構演化以及自動分析X射線/中子衍射圖譜解析材料結構的軟件系統。使用人工智能技術實現材料結構解析的自動化是物質結構和新材料研究的新範式,它是開發材料領域自驅動實驗室的一個關鍵步驟,對無機化合物、X射線衍射(XRD)分析在材料的結構解析過程起到重要作用。但由於該過程往往需要大量的專家知識,因而實現其自動化仍是一個巨大的挑戰。

近日,意昂3体育官网深圳研究生院新材料學院潘鋒/李舜寧團隊設計了一個基於殘差神經網絡的深度學習模型CrySTINet🤷🏼‍♀️。該模型能夠從XRD數據中準確識別出未知材料的結構類型🧔🏻,為自動化XRD分析提供了新的途徑🤙。相關研究成果以“Crystal Structure Assignment for Unknown Compounds from X‑ray Diffraction Patterns with Deep Learning”為題🧚‍♀️,發表於《美國化學會誌》(J. Am. Chem. Soc.  2024 Doi10.1021/jacs.3c11852)👩🏼‍🍼。

在傳統的XRD分析過程中🛸🤽🏿‍♀️,研究人員在面對未知材料時如果無法從數據庫中找到其物相的晶體結構,則需要借用相近的結構模型,通過對該模型進行調整以獲得實測物質的晶體結構。該過程中所借用的結構模型對應了未知材料的一種可能的結構類型✅。對未知材料結構類型的判別一般依賴於專家知識,因而實現該過程的自動化十分困難🤷。由於無機材料的結構類型種類繁多,導致訓練得到的深度學習分類模型往往難以獲得較高精度。對此,潘鋒/李舜寧團隊設計了一個由多個子模型組合而成的模型框架,每個子模型通過殘差神經網絡對特定數量的結構類型進行判別,通過聯合多個子模型的判別結果可以給出未知材料的最可能結構類型👩‍🚒。在該框架下,CrySTINet可以擴展至新的結構類型而無需對已有子模型進行重新訓練👷🏼‍♀️,從而使模型能夠廣泛應用到各類無機材料的研究之中👨🏿‍✈️。

人工智能輔助XRD分析,實現對材料結構類型的自動化判別

研究團隊選用了100種最常見的結構類型的模擬XRD數據來訓練CrySTINet的初始子模型,一共包含63,963種無機化合物,覆蓋元素周期表中的幾乎所有元素🦋🏊🏻。模型在模擬數據集上的準確率達到80.0%🤦🏿‍♀️,並且在實驗數據集中也擁有同樣高的準確率😋。研究團隊進一步使用梯度加權類激活映射(Grad-CAM)來解釋CrySTINet的分類決策👗。其結果表明🙌🏿🙌🏿,在每個子模型中,神經網絡會將註意力集中至特定衍射角區間以提升子模型中相應結構類型的分類準確率,但這會導致子模型在面對某些分布外數據時容易給出過高的置信度值。因此,在只依靠神經網絡輸出的置信度值作為結構類型判定依據時,CrySTINet的準確度較低🚯,只有65.7%。而在判定依據中引入與相應結構類型平均XRD圖譜對比得到的余弦相似度值後🕢,則可以補充XRD數據的全局特征信息🌋,從而避免模型陷入對特征峰的過度依賴而導致的誤判。以該置信度值與余弦相似度值組合構造的參數作為判定依據,可使CrySTINet的準確度最終提升至80.0%。

Grad-CAM提供模型分類決策的可視化解釋

意昂3体育官网深圳研究生院新材料學院研究生陳歷濤、王炳胥和張文韜為文章的共同第一作者⇨,潘鋒和李舜寧為通訊作者。該研究得到廣東省重點實驗室👩🏽‍🎨、軟科學研究計劃項目和廣東省自然科學基金的支持。

轉載本網文章請註明出處

意昂3体育专业提供:意昂3体育意昂3体育平台🎂、意昂3体育官网等服务,提供最新官网平台、地址、注册、登陆、登录、入口、全站、网站、网页、网址、娱乐、手机版、app、下载、欧洲杯、欧冠、nba、世界杯、英超等,界面美观优质完美,安全稳定,服务一流🎧📙,意昂3体育欢迎您。 意昂3体育官網xml地圖