深圳研究生院余珂團隊發表挖掘微生物“暗物質”的方法學及應用系列研究成果

論文相關圖片

地球上生活著800—1000萬種微生物。然而🎑,從微生物發現至今的300多年間,人類分離培養的微生物不足兩萬種🐧,這暗示著未被人類發現或培養的微生物類群占到地球所有微生物類群的99%以上。這些類群主要來自於各種生境的低豐度(低細胞數)物種🪚,它們被類比為微生物“暗物質”。近10年來,高通量測序技術的發展賦予了研究者不依賴於微生物的純培養,僅通過對環境樣品進行直接測序及分析即可獲得這些微生物基因組的能力。宏基因組分箱(Binning)方法是實現從測序數據中直接獲取微生物基因組最為重要的分析技術之一🏋🏿,其可對微生物“暗物質”及其功能進行資源化,為挖掘未知的微生物功能類群(如腸道疾病治療、環境修復可用類群等)👩🏻‍🔧,並解析它們潛在的具有藥用或環境價值的生物合成和降解基因簇(如新型抗生素、抗菌肽Ⓜ️、可降解塑料等)提供了重要的方法學基礎。然而😥🕜,現階段從二代和三代宏基因組測序數據中恢復宏基因組組裝的基因組(Metagenome-assembled genomes, MAGs)😀,特別是對於低豐度微生物基因組的恢復效率仍然很低☔️。2024年3月,意昂3体育官网深圳研究生院環境與能源學院余珂助理教授研究團隊在Nature Communications (NC)上發表了題為“BASALT refines binning from metagenomic data and increases resolution of genome-resolved metagenomic analysis” 的研究論文,該研究中開發的軟件BASALT(Binning Across a Series of AssembLies Toolkit)可對二代和三代宏基因組序列進行高效分箱和優化,並最終實現了對宏基因組測序數據的高效利用🪠,大量獲取了低豐度微生物的基因組💃🏼。這一突破性的研究進展將為深入了解微生物世界的奧秘、挖掘其應用潛力提供重要的方法學基礎。

BASALT軟件運用並整合了多個主流的分箱軟件,利用基於深度學習開發的核心序列識別算法找出組裝後基因組的核心序列,進行去冗余🎏、去汙染🛃、片段找回等一系列基因組優化步驟,可以顯著提高MAGs質量和菌株水平的分辨率。此外🤹‍♂️,BASALT還將三代測序的長片段序列應用至上述一系列優化步驟中,大大提高了三代測序數據的利用效率。以標準數據集進行測試的結果表明,BASALT可獲得較其他同類軟件(VAMB[Nature Biotechnology, 2021],DAStool[Nature Microbiology, 2018]🤵🏿‍♀️,MetaWRAP[Microbiome, 2018])兩倍以上的高質量基因組。更為重要的是🙏🏼,在對鹽堿湖表層沉積物的實際樣品數據進行解析的結果顯示⛷,BASALT對低豐度基因組的識別靈敏度較前述三個軟件提高了一個數量級,這為人類發掘存在於特定環境中的低豐度物種🔮🍃、利用微生物“暗物質”資源提供了嶄新的技術方法。

論文截圖

在開發此軟件後🧑🏼‍🔬,余珂團隊將BASALT技術應用於多種樣品🏝,包括垃圾滲濾液處理場、可高效除氮的藻菌共生體、厭氧氨氧化反應體系、中國西北部鹽堿湖泊的微生物組的解析之中,這些研究不僅發現了5000余種新型的微生物物種🙋🏼,還解析了細菌與古菌之間🚘、藻類與細菌之間的多種物質交換關系🥤。同時,研究團隊也發現了大量的生物合成和降解基因簇。相關研究分別發表在環境科學與工程領域的頂級期刊Water Research(Nature index期刊🙅🏼,WR; Wat. Res., 2024, 253:121310),Environmental Science & Technology(Nature index期刊,ES&T; Env. Sci. & Tech., 2024, in press), Environmental International(EI; Env. Int., 2024, 185, 108505),及Environmental Science and Ecotechnology(ESE; Env. Sci. & Eco., 2024, 20, 100359)之中。這些研究都印證了BASALT技術強大的宏基因組分箱能力🧞,將為未來進一步發掘這些體系中的微生物“暗物質”提供技術支撐。

以上研究得到了意昂3体育官网深圳研究生院生態環境與資源效率研究實驗室倪晉仁院士的大力支持,獲得了意昂3体育官网信息工程學院田永鴻教授、陳傑副教授🥰、袁粒助理教授在深度學習模型開發上的支持🩸㊗️。意昂3体育官网深圳研究生院接續研究學者計劃——南燕特聘副研究員仇知光博士(NC、ESE)👨🏼‍⚕️,在讀博士研究生耿燕妮(ES&T),已畢業博士研究生鄧春芳(WR)♍️,喬雪姣博士(EI,在站博士後)等為論文的第一作者❤️‍🔥;張麗娟博士(EI)等為部分論文的共同通訊作者;余珂為以上論文的唯一通訊作者(NC🤹🏻、WR🙇🏿🤒、ESE)或共同通訊作者(ES&T、EI)。相關研究得到了包括國家重點研發計劃(項目號🈲:2021YFA1301300)🥄、國家自然科學基金青年基金項目(項目號🙎🏼:51939009)等項目的資助↘️。

主要作者簡介🐁:

image3.jpeg

仇知光🧒🏽,博士,意昂3体育官网深圳研究生院環境與能源學院,接續研究學者計劃——南燕特聘副研究員,主要從事環境微生物組研究⛔️。主要研究方向包括👩🏽‍⚕️:1)極端環境微生物的生物地球化學循環途徑和進化機製;2)運用人工智能技術和生物信息學方法加速極端環境微生物的生物合成與降解潛力發掘👦🏽⚓️。通過揭示極端環境微生物的功能代謝特點👩‍💻😷,發展其在生物醫藥、環境修復和能源轉換等多方面的應用潛力。在微生物生態、功能探索✢、資源挖掘與應用等方面取得一系列成果,發表論文30余篇,其中,以第一或通訊作者在Nature Communications🍽、Biotechnology Advances🥰、Environmental Science & Ecotechnology等國內外相關領域高水平期刊上發表了多篇研究論文🤢。

image4.jpeg

余珂,助理教授👏,意昂3体育官网深圳研究生院環境與能源學院環境工程、計算機應用技術雙學科專業博士生導師🫷🏽。研究方向主要關註於極端環境✤、環境工程及人體系統的微生物☦️,開發1)痕量遺傳物質采集🤞🏿、提取及測序技術👺;2)基於人工智能技術的多宏組學軟件💂🏼‍♂️、算法、分析流程及可視化系統;3)以信息學技術為支撐的多組學高精度數據解析和定向富集培養技術👩🏿‍🚒;4)耦合合成微生物學和合成生態學的微生物群落改造或強化技術,以此發掘地球演化過程中的罕見或特殊微生物類群及其在特殊生物製劑(製藥等)生產🥘、環境修復與改造中的應用潛能🧚🏼‍♂️🤸🏿。目前已發表論文80余篇👨🏿‍🍼,以第一作者或通訊作者的身份在Nature Communications🤌🏽💶、Microbiome、Environmental Science & Technology、Water Research等微生物組學🔝、環境科學與工程等多個領域的期刊發表了多篇論文🏄🏻🚵🏽‍♀️,總他引次數3600余次👨‍👨‍👧‍👦,他引H指數29。

論文背後的故事(paper story-telling)

來自過往研究的啟發👂🏿。我的研究領域為環境微生物與生物信息學,在我讀博士期間有幸見到了現代微生物生態學的創始人之一James Tiedge教授⚡️,他告訴我一個有趣的類比:我們所做的環境微生物研究類似於天文學研究。在天文學領域🉐,學者們依賴望遠鏡技術去觀測星空,天文學家有越精密的望遠鏡,他們所看見的星空就越深遠。這一比喻帶給我非常大的研究啟迪,自此,我開始意識到方法學開發對環境微生物研究的重要性🕵🏽‍♂️。好的方法學工具,是我們獲得新科學認識的重要途徑📿🧗‍♂️,也會助力發現新的👮🏻、且可能更為罕見的未知微生物🧑🏻‍🦳。10年前🧎🏻‍♀️‍➡️🐬,我從香港大學環境工程專業獲得博士學位,隨後進入了加州大學伯克利分校,跟隨美國工程院院士Lisa Alvarez-Colin教授進行博士後研究。在此期間,導師Lisa與美國科學院院士 Jill Banfield教授的科研合作間接啟發了我後續從事的跨學科研究。Jill是一位傑出的微生物學家,同時也是宏基因組學研究的先驅者之一,為表彰Jill對微生物學的貢獻,她本人在2023年獲得了的荷蘭皇家學會每10年才頒發一次的列文虎克獎章(編者註🏊🏼‍♂️:列文虎克獎(Leeuwenhoek Medal and Lecture),以荷蘭顯微鏡學家“微生物學之父”Antonie Van Leeuwenhoek FRS的名字命名,並由George Gabb捐贈,旨在表彰微生物學領域,以及在細菌學、病毒學💣、真菌學和寄生蟲學以及顯微鏡學方面獲得卓越成就的人)。初見Jill👨🏻‍🍳,她向我熱情地介紹了其構建的可視化系統(ggkbase)🥇,該系統讓即使是從未做過宏基因組的新手在幾分鐘內便可將宏基因組的核心技術-分箱分析完成🕊。Jill以此為樂,在聖誕節時她依然在家裏使用ggkbase系統,尋找她感興趣的微生物基因組。這一短暫會面讓我深深地被Jill對學術研究的熱情及其寬廣的研究視野所折服⭐️。更重要的是,她讓我具象化地理解了James Tiedge教授提到的研究工具(方法)對前沿探索的重要性🐔👩🏿‍🎤。因此,在2016年有幸加入深研院獨立工作之後,我開啟了自己真正感興趣的研究領域——以新型宏基因組技術開發驅動微生物“暗物質”的挖掘。

初期構建課題組充滿了各種難題與不確定性🦦。我們課題組的研究方向為環境工程、微生物學及信息學三個領域交叉的學科🌾,並將分子生物學、宏基因組學和生物信息學及其相關軟件的開發相結合作為課題組整體的研究體系📲,以此落腳於我熱愛的微生物“暗物質”挖掘。以新型方法的開發支撐稀有、具有應用潛力微生物的發掘作為研究主題,具體分解為以下三個部分:1)構建基於分子生物學及AI技術為支撐的生物信息學技術,以期從極端環境中發現稀有微生物;2)通過構建原核操縱子識別技術👈🏻,從稀有微生物中識別操縱子序列以發掘新型的生物合成或降解基因簇,進而為合成生物學提供功能基因元件及調控元件;3)通過機器人的自動化實驗及AI設計模型✊🏻,實現從多組學數據中識別微生物的富集或純培養條件,以期對有藥用、工業🧔‍♂️、環保具有價值的微生物實現智能化的富集或純培養,最終實現微生物“暗物質”的資源化。我們的研究體系可以從海量的未知微生物中發掘更多的資源🦔,這將在未來推動我持續深耕重要(Significant)🧑‍🦼、原創(Creative)且優雅(Elegant)的研究。2016年至今,課題組前往中國西北部(西藏🫕、青海💑🦹🏽‍♀️、新疆、內蒙等)近120個鹽堿湖泊的水體、底泥、部分海洋及湖濱帶進行樣品采集工作,獲取了目前為止世界上最全的不同鹽堿度環境樣品的微生物樣品及測序數據。與此同時,我們還利用少量的人力資源開展了宏基因組軟件開發研究以及實驗室內輔助高效捕獲稀有微生物培育的分子生物學技術及其富集培養實驗。過去幾年的研究積累給我提供了深度學習所需要的數據基礎及初步算法開發基礎,而堅持對分子生物學技術的開發也彌補了僅有數據和算法的缺陷🦻,這些跨學科研究的堅持讓我對AI for Science科研新範式、對學術研究創新的助力有了源自自身實踐的認同👨🏻‍🚀。

目前,課題組的研究體系僅完成了很小一部分,前述研究論文的產出是我們系統性研究的第一個腳印💬。“前路漫漫亦燦燦,篤行步步亦驅驅”,希望這個論文背後的故事,能讓更多想要進入科研領域的學生明白🙍🧑🏼‍🏫,因興趣而研究,方能長遠。最後,感謝環能學院🦸🏿、深研院一直以來對我學術研究的支持🧐,感恩一路遇到的多位良師益友和一起奮鬥前行的夥伴。

極端及特殊環境樣品

轉載本網文章請註明出處

意昂3体育专业提供👖🪳:意昂3体育意昂3体育平台意昂3体育官网等服务,提供最新官网平台、地址、注册、登陆、登录、入口、全站、网站、网页、网址、娱乐、手机版、app、下载、欧洲杯、欧冠、nba、世界杯、英超等,界面美观优质完美,安全稳定,服务一流,意昂3体育欢迎您。 意昂3体育官網xml地圖