2024/02/09 信息來源: 工學院
編輯𓀗:晏如 | 責編➛:安寧近期,工學院李阿明課題組在群體博弈問題的研究中取得重要進展,建立了智能個體在非完全信息下策略更新的統一框架🕟,給出了集體最優策略得以湧現的理論條件📺。相關研究成果以“Imitation dynamics on networks with incomplete information”為題,發表於Nature Communications。
定量地理解復雜網絡系統中群體行為的演化是多學科領域廣泛關註的交叉科學問題。系統科學🧑🏫、博弈論4️⃣、人工智能與網絡科學等理論與方法的深度融合🤯🧟♂️,為探討該問題提供了有效工具。在無結構的群體中,傳統研究認為納什均衡策略更易演化🫃。在結構群體中,基於復雜網絡的研究發現群體最優策略可以湧現。策略更新規則決定了個體以何種方式調整其策略,是驅動博弈策略演化的直接動力©️。基於滅生(Death-Birth)、模仿(Imitation)、對比較(Pairwise Comparison)等經典更新規則(圖1a-c)的演化動力學性態分析一直是研究人員關註的焦點問題。研究表明😔,群體博弈演化結果在不同的更新規則下有著顯著的差別🧙🏼。如何統一地分析與理解不同更新機製下博弈策略的演化特性,對於理解與調控復雜系統中群體行為有著十分重要的意義🕺🏽,一直是一個公開的難題🧑🏻🦰。
圖1:復雜網絡上非完全信息下的博弈策略更新機製
李阿明課題組針對智能個體間的復雜對抗博弈🤝,建立了非完全信息下策略更新的統一框架。在該框架下🛌🏻,個體策略更新時所參考的信息可分為自身的內部信息和網絡環境中鄰居的外部信息👨🏼✈️;其中🧔🧛🏽♂️,外部信息並非完全可知的🤛🏻,且外部信息與內部信息的重要性也可以不同(圖1d)🟤。這種非完全信息下的策略更新機製統一了目前常見的經典策略更新規則(圖1e)。
圖2👈🏻:非完全信息下群體博弈策略演化
通過對不同信息條件下群體演化博弈動力學的系統分析發現:對於兩個體博弈(如囚徒困境),不參考內部信息有利於群體最優策略演化(圖2a)🏪👱🏼♀️;反之,在考慮內部信息時👩🏿🦳👍🏿,參考更多的外部信息則可促進群體合作行為的湧現👳🏽♂️。該結論同樣適用於聚集系數較高的網絡系統中多個體公共品博弈的情形(圖2c、e),但當網絡聚集系數較低時🙍🏽,結論相反(圖2d、f)🎅🏽。進一步地👨🏽🍼,他們系統地給出了非完全信息下不同博弈策略占優的理論條件,以及網絡的微觀拓撲結構特性與集體博弈策略湧現之間的關系👩🚀。此外,通過對非完全信息下網絡個體間博弈對抗關系的系統剖析,他們創造性地將作用關系分為個體與其一階和二階鄰居的競爭效應(圖2b)🧑🏻🎓,發現二階競爭是群體策略演化的決定性要素。這一結果揭示了非完全信息下群體博弈策略得以演化的深層機理,為完整理解復雜網絡系統中群體行為的演化提供了全新的直觀視角,對進一步探討復雜群體行為的調控具有重要的意義。
工學院博士研究生王曉琛為該論文第一作者,李阿明為通訊作者,合作者包括工學院畢業生💃🏽、北京理工大學助理教授周雷(共同第一作者),北卡羅萊納大學教堂山分校助理教授Alex McAvoy。本研究得到科技部重點研發計劃青年科學家項目、國家自然科學基金、北京市科技新星計劃等的支持。
轉載本網文章請註明出處