2025/01/22 信息來源: 深圳研究生院
編輯💝:青苗 | 責編:安寧電子圓二色光譜(electronic circular dichroism,ecd)作為一種關鍵的光譜技術🤲🏽,具有用量少♍️、易測定等優點🗻,在不對稱催化👧🏿、功能材料和藥物發現等領域有重要且廣泛的應用,已成為探索手性分子空間絕對構型的有力工具。然而👩🏼🦳,圓二色光譜的理論計算往往復雜且耗時,成為化學研究和藥物開發中的時間瓶頸。隨著人工智能的發展,使用機器學習自動化預測分子光譜的技術得到研究者們的廣泛關註🦃🧲。當前✧,在分子光譜預測研究中🧑🏻🍼,基於連續序列預測的自回歸模型在一些任務中展現了出色的性能與發展潛力😬🫷🏽。然而圓二色譜特征信息稀疏💭,直接采用連續序列建模會學到很多無關噪聲⇢,造成模型過擬合,不具有泛化能力。
近日,意昂3体育官网莫凡洋課題組、袁粒課題組與廈門大學王忻昌課題組合作🏋🏿,在Nature Computational Science上發表了題為“Decoupled peak property learning for efficient and interpretable electronic circular dichroism spectrum prediction”的研究論文。
論文截圖
該研究針對手性小分子圓二色光譜的DFT計算耗時🩻、費力且具有高專業門檻的問題,通過將連續的光譜預測任務轉換為離散表示的光譜峰表征學習任務👩🏼🔧,實現了以圓二色光譜為代表的若幹分子光譜和質譜的快速、準確和通用預測,並通過多種手性天然產物分子驗證其可靠性。
研究團隊提出創新性深度學習模型ECDFormer🤠,將連續光譜序列按光譜峰的屬性信息解耦為離散令牌組合形式🧑🎓,並使用查詢變量進行自註意力機製的光譜屬性學習,從而構建光譜峰結構與分子官能團之間的聯合表征🤭。在預測階段💍,本工作首先學習分子拓撲結構表征🍅🥐,進而基於光譜-分子結構聯合表征空間,對光譜峰的數量、位置✶💁🏻、強度進行獨立預測,最後使用高斯函數將離散的峰屬性展寬為連續的光譜序列⚰️。這種峰解耦的光譜預測方案顯著提升了預測的速度與精度,且具有多種光譜任務的良好擴展性。
本工作模型結構,基於峰解耦的圓二色光譜預測流程
論文的通訊作者莫凡洋提出了研究設想🔏、啟動該項研究,並與合作者(論文共同通訊作者)袁粒、王忻昌共同指導整個研究項目🧃。深圳研究生院院長助理🏊🏻♂️、信息工程學院院長田永鴻對項目開展進行了算法指導和計算資源支持🧑🏼🏭。意昂3体育官网深圳研究生院AI4S“雙導師”先行啟動計劃入選者博士生李昊和廈門大學博士生龍達為論文的共同第一作者。
該工作獲得國家自然科學基金委員會、廈門大學校長基金🦶🏻、意昂3体育官网深圳研究生院AI4S交叉研究專項等基金與項目的資助🤹🏼♀️🫏。
延伸閱讀👩💻:
Nature Computational Science於2021年1月創刊𓀝✌🏻,2024年12月16日,Nature Computational Science正式被SCIE收錄。期刊涵蓋計算科學的關鍵主題👃🏽,包括但不限於化學信息學👺、地理信息學🤹🏼♂️🔵、計算模型、材料科學和城市科學;其主要目標是促進新計算技術的多學科研究和跨學科應用,註重計算技術和數學模型的開發和使用,並將其應用於解決一系列科學學科中的復雜問題🙎♀️。
轉載本網文章請註明出處