Activities
導(dǎo)讀:2025年7月5日,由中國(guó)科學(xué)技術(shù)協(xié)會(huì)主辦、中國(guó)自動(dòng)化學(xué)會(huì)承辦的復(fù)雜系統(tǒng)自學(xué)習(xí)“逆最優(yōu)”理論與方法專題論壇在中國(guó)科技會(huì)堂召開。
華北電力大學(xué)教授肖峰受邀參加本次專題論壇并作題為“信息物理融合能源系統(tǒng)的協(xié)同控制與優(yōu)化”的報(bào)告。報(bào)告以分布式能源為研究背景,圍繞信息物理系統(tǒng)的分布式控制與決策的建模與分析,給出以下方向的研究成果:信息物理系統(tǒng)的穩(wěn)定性與魯棒性、網(wǎng)絡(luò)攻擊下微電網(wǎng)的安全與協(xié)同控制、事件驅(qū)動(dòng)協(xié)同優(yōu)化、分布式納什均衡搜索、聚合博弈中的在線分布式學(xué)習(xí)等。研究成果刻畫了子系統(tǒng)網(wǎng)絡(luò)間的耦合作用,揭示了個(gè)體動(dòng)力學(xué)、通信網(wǎng)絡(luò)結(jié)構(gòu)和個(gè)體利益最大化之間的關(guān)系。研究結(jié)果應(yīng)用到分布式能源系統(tǒng)在網(wǎng)絡(luò)攻擊和競(jìng)爭(zhēng)機(jī)制下的協(xié)同與博弈建模、策略演化研究中,為構(gòu)建新型能源管理系統(tǒng)提供了理論支撐。
一、研究背景
在現(xiàn)代電力系統(tǒng)中,微電網(wǎng)作為一種新興的系統(tǒng)形態(tài),正逐漸成為推動(dòng)能源轉(zhuǎn)型與分布式能源接入的關(guān)鍵技術(shù)路徑。微電網(wǎng)的概念最早于二十年前在美國(guó)提出,它的目的是構(gòu)建一種具備自治能力的小型電力系統(tǒng),如圖1所示。其核心組成部分包括:分布式電源、儲(chǔ)能系統(tǒng)、可控負(fù)荷以及相關(guān)電力電子設(shè)備。經(jīng)過多年的發(fā)展,尤其是隨著2015年我國(guó)可再生能源政策的加速推進(jìn),以及《能源生產(chǎn)和消費(fèi)革命戰(zhàn)略》等國(guó)家層面政策的持續(xù)引導(dǎo),微電網(wǎng)被明確提出加強(qiáng)與智能電網(wǎng)深度融合,成為支撐我國(guó)能源綠色轉(zhuǎn)型的重要技術(shù)途徑之一。
圖1 微電網(wǎng)
微電網(wǎng)具有典型的分布式、自治與雙向互動(dòng)特性,是分布式能源系統(tǒng)的重要代表形式。其主要特征體現(xiàn)在:能夠?qū)崿F(xiàn)發(fā)電側(cè)與負(fù)荷側(cè)之間的信息與能量的雙向交互;同時(shí),通過儲(chǔ)能系統(tǒng)實(shí)現(xiàn)負(fù)荷調(diào)節(jié)與能量管理,從而在一定程度上具備“源-荷-儲(chǔ)”一體化的運(yùn)行能力。微電網(wǎng)不僅在提高可再生能源就地消納方面具有顯著優(yōu)勢(shì),還能有效提升系統(tǒng)運(yùn)行的安全性與可靠性,降低碳排放與運(yùn)行成本,因此被廣泛視為實(shí)現(xiàn)清潔低碳能源系統(tǒng)的關(guān)鍵路徑之一。我們聚焦于微電網(wǎng)架構(gòu)設(shè)計(jì)、運(yùn)行控制與優(yōu)化調(diào)度等關(guān)鍵問題展開相關(guān)工作。
根據(jù)結(jié)構(gòu)形式的不同,微電網(wǎng)可劃分為交流微電網(wǎng)、直流微電網(wǎng)及交直流混合微電網(wǎng)三種類型,如圖2所示。其中,交流微電網(wǎng)因涉及頻率和相位調(diào)控問題,其系統(tǒng)控制較為復(fù)雜;而直流微電網(wǎng)便于可再生能源和儲(chǔ)能系統(tǒng)的接入,無(wú)需考慮無(wú)功補(bǔ)償和頻率同步等問題,控制相對(duì)簡(jiǎn)單。交直流混合微電網(wǎng)則兼具兩者優(yōu)勢(shì),能夠兼容多種能源和負(fù)荷形式,具備更強(qiáng)的系統(tǒng)靈活性與擴(kuò)展性,但其控制系統(tǒng)設(shè)計(jì)與協(xié)調(diào)機(jī)制更為復(fù)雜,對(duì)系統(tǒng)集成與控制策略提出了更高要求。
圖2 微電網(wǎng)類型
根據(jù)其與主電網(wǎng)的連接方式,微電網(wǎng)可分為并網(wǎng)型微電網(wǎng)與孤島型微電網(wǎng)。前者與主電網(wǎng)存在能量與信息交互,可在主電網(wǎng)發(fā)生故障時(shí)實(shí)現(xiàn)快速切換運(yùn)行;而后者則通常部署在工業(yè)園區(qū)、孤立區(qū)域等場(chǎng)景中,具備獨(dú)立運(yùn)行能力,完全依賴本地資源實(shí)現(xiàn)能源供給與調(diào)度管理。從控制體系結(jié)構(gòu)來(lái)看,微電網(wǎng)通常采用三級(jí)控制架構(gòu):一級(jí)控制、二級(jí)控制和三級(jí)控制,分別對(duì)應(yīng)不同的時(shí)間尺度和控制目標(biāo),如圖3所示。一級(jí)控制的目標(biāo)是實(shí)現(xiàn)系統(tǒng)的電壓與頻率穩(wěn)定,維持功率的供需平衡。該層通常采用下垂控制策略,可適用于多分布式電源并聯(lián)的運(yùn)行模式。依據(jù)控制方式不同,一級(jí)控制可進(jìn)一步分為主從式控制與對(duì)等式控制。其中,在對(duì)等控制中,各發(fā)電單元均采用下垂控制進(jìn)行自主調(diào)節(jié),但由于線路阻抗和下垂系數(shù)的影響,系統(tǒng)總線電壓與期望電壓間會(huì)產(chǎn)生偏差,需要通過更高層級(jí)的協(xié)調(diào)控制予以修正。
圖3 微電網(wǎng)分層控制架構(gòu)
二級(jí)控制主要功能在于恢復(fù)系統(tǒng)頻率和電壓至參考值,并實(shí)現(xiàn)多發(fā)電單元之間的協(xié)調(diào)運(yùn)行。控制策略主要分為三類:集中式控制、分散式控制和分布式控制,如圖4所示。集中式控制結(jié)構(gòu)清晰但對(duì)通信網(wǎng)絡(luò)的依賴程度高,存在單點(diǎn)故障風(fēng)險(xiǎn);分散式控制中每個(gè)節(jié)點(diǎn)獨(dú)立運(yùn)行,雖然具有一定魯棒性,但缺乏全局協(xié)同能力;而分布式控制結(jié)合分散式控制的局部控制與集中式控制的信息共享優(yōu)勢(shì),通過節(jié)點(diǎn)間的信息交互提高了系統(tǒng)的可擴(kuò)展性與容錯(cuò)性,因而近年來(lái)受到了廣泛關(guān)注。盡管如此,分布式控制在優(yōu)化算法設(shè)計(jì)、通信協(xié)議構(gòu)建與系統(tǒng)穩(wěn)定性等方面仍面臨諸多挑戰(zhàn)。
圖4 典型的控制策略
三級(jí)控制主要面向系統(tǒng)級(jí)的調(diào)度與經(jīng)濟(jì)運(yùn)行,核心任務(wù)是進(jìn)行全局范圍內(nèi)的能源資源優(yōu)化配置。三級(jí)控制系統(tǒng)通常集成能量管理系統(tǒng)、調(diào)度優(yōu)化器、功率分配器等功能模塊,依據(jù)系統(tǒng)中各類電源、儲(chǔ)能設(shè)備以及可控負(fù)荷的運(yùn)行特性,制定最優(yōu)運(yùn)行策略。其目標(biāo)不僅在于保障供電穩(wěn)定與經(jīng)濟(jì)運(yùn)行,更強(qiáng)調(diào)降低系統(tǒng)碳排放,促進(jìn)綠色能源的高效利用。
以微電網(wǎng)為典型代表的信息物理融合系統(tǒng)的結(jié)構(gòu)一般可劃分為五層:物理層、感知層、網(wǎng)絡(luò)層、控制層與應(yīng)用層,如圖5所示。其中,感知層負(fù)責(zé)數(shù)據(jù)采集與狀態(tài)監(jiān)測(cè),控制層實(shí)現(xiàn)實(shí)時(shí)反饋調(diào)節(jié),是實(shí)現(xiàn)系統(tǒng)自適應(yīng)與智能化的關(guān)鍵。引入通信網(wǎng)絡(luò)后,微電網(wǎng)也隨之面臨諸多網(wǎng)絡(luò)安全風(fēng)險(xiǎn),因此必須針對(duì)信息物理系統(tǒng)的安全問題制定有效的抵御防護(hù)機(jī)制。
圖5 微電網(wǎng)信息物理融合系統(tǒng)
典型的網(wǎng)絡(luò)攻擊類型包括:拒絕服務(wù)(DoS)攻擊,其通過大量冗余數(shù)據(jù)或虛假請(qǐng)求占用網(wǎng)絡(luò)資源,造成控制器間通信中斷,從而影響系統(tǒng)穩(wěn)定性;虛假數(shù)據(jù)注入(FDI)攻擊,其通過篡改或控制數(shù)據(jù),破壞系統(tǒng)狀態(tài)估計(jì)與優(yōu)化調(diào)度,導(dǎo)致運(yùn)行效率下降甚至系統(tǒng)癱瘓;竊聽攻擊,其監(jiān)聽和捕獲在網(wǎng)絡(luò)中傳輸?shù)臄?shù)據(jù),獲取機(jī)密信息;重放攻擊,其截獲并重新發(fā)送數(shù)據(jù),偽裝成合法通信,欺騙目標(biāo)系統(tǒng)。
DoS攻擊可細(xì)分為持續(xù)型、周期型、隨機(jī)型和能量受限型等,如圖6所示。能量受限模型下,能量受限于設(shè)計(jì)的最大持續(xù)時(shí)間與允許發(fā)生最大頻率,以最小資源消耗達(dá)到最大破壞效果。針對(duì)這類攻擊,研究的核心問題是系統(tǒng)的穩(wěn)定性與魯棒性控制,同時(shí)也需要考慮網(wǎng)絡(luò)通信的實(shí)時(shí)性、帶寬受限等挑戰(zhàn)。
圖6 Dos攻擊類型
本報(bào)告的研究?jī)?nèi)容主要圍繞信息物理融合能源系統(tǒng)在面臨網(wǎng)絡(luò)通信受限、網(wǎng)絡(luò)攻擊下的協(xié)同控制與優(yōu)化決策問題展開,具體分為三個(gè)方面:一是系統(tǒng)穩(wěn)定性與魯棒性分析;二是安全控制與協(xié)同機(jī)制設(shè)計(jì);三是非合作博弈與優(yōu)化。
二、異步信息物理系統(tǒng)的穩(wěn)定性與魯棒性
在分布式控制架構(gòu)下,每個(gè)節(jié)點(diǎn)系統(tǒng)具有自主決策能力,導(dǎo)致系統(tǒng)控制在時(shí)序上呈現(xiàn)出明顯的異步特征。這種異步性主要來(lái)源于三方面:其一,子系統(tǒng)間在控制與決策執(zhí)行過程中的相對(duì)獨(dú)立性;其二,各網(wǎng)絡(luò)節(jié)點(diǎn)在信息處理時(shí)存在不同程度的時(shí)間延遲;其三,網(wǎng)絡(luò)延遲、拓?fù)浣Y(jié)構(gòu)變化或受到攻擊時(shí),會(huì)使原本同步的信息流變?yōu)榉峭健?/span>
事件驅(qū)動(dòng)控制是一種有效應(yīng)對(duì)網(wǎng)絡(luò)資源受限、降低通信頻率的控制方法,但在分布式控制架構(gòu)下,其非周期性驅(qū)動(dòng)的特性會(huì)導(dǎo)致系統(tǒng)動(dòng)態(tài)行為的異步性。傳統(tǒng)的事件驅(qū)動(dòng)策略多基于單一的邏輯變量與靜態(tài)規(guī)則設(shè)計(jì)事件驅(qū)動(dòng)條件。這類方法形式簡(jiǎn)單、易于實(shí)現(xiàn),但在應(yīng)對(duì)系統(tǒng)復(fù)雜動(dòng)態(tài)特性、網(wǎng)絡(luò)異步性以及安全威脅等方面存在明顯局限。其另外一個(gè)缺陷是事件可能在短時(shí)間內(nèi)密集發(fā)生,即發(fā)生Zeno行為,造成短期通信壓力上升,影響全局穩(wěn)定性。因此事件分離特性是事件驅(qū)動(dòng)控制系統(tǒng)的重要性質(zhì)。對(duì)于如何擴(kuò)大事件間隔問題,文獻(xiàn)中基于單一邏輯變量的靜態(tài)規(guī)則方法屬于“間接方法”,即在事件條件設(shè)計(jì)完成后分析驗(yàn)證事件間隔是否滿足系統(tǒng)性能要求。為突破這一限制,我們提出一類“直接方法”,稱為復(fù)雜邏輯驅(qū)動(dòng)控制,其依賴于多個(gè)邏輯變量和復(fù)雜動(dòng)態(tài)規(guī)則,在控制協(xié)議設(shè)計(jì)階段便考慮事件間隔與驅(qū)動(dòng)頻率約束。有助于提高系統(tǒng)設(shè)計(jì)的靈活性和可預(yù)測(cè)性,為進(jìn)一步提高控制性能提供可能途徑。
2.1復(fù)雜邏輯驅(qū)動(dòng)控制
復(fù)雜邏輯驅(qū)動(dòng)控制包括時(shí)間-事件混合驅(qū)動(dòng)控制、切換型事件驅(qū)動(dòng)控制、雙檢/多檢事件驅(qū)動(dòng)控制等。時(shí)間-事件混合驅(qū)動(dòng)控制包括周期事件驅(qū)動(dòng)控制、異步非周期事件驅(qū)動(dòng)控制、強(qiáng)制駐留時(shí)間類型事件驅(qū)動(dòng)控制等。
在周期事件驅(qū)動(dòng)控制中,事件的發(fā)生依賴于兩個(gè)并列條件:一為傳統(tǒng)的狀態(tài)相關(guān)的事件驅(qū)動(dòng)條件;二為時(shí)間條件,用于約束事件驅(qū)動(dòng)條件檢測(cè)時(shí)間在周期性的時(shí)間點(diǎn)集上。只有當(dāng)這兩個(gè)條件同時(shí)滿足時(shí),系統(tǒng)才會(huì)被驅(qū)動(dòng)以采取必要的控制操作。異步非周期事件驅(qū)動(dòng)控制機(jī)制也可同樣被表達(dá)為兩個(gè)邏輯變量的合取,其中時(shí)間條件約束事件檢測(cè)時(shí)間點(diǎn)集。強(qiáng)制駐留時(shí)間類型事件驅(qū)動(dòng)控制機(jī)制可以表達(dá)為三個(gè)條件的順序判斷,是一種動(dòng)態(tài)規(guī)則,涉及三個(gè)邏輯變量,分別對(duì)應(yīng)駐留時(shí)間條件、狀態(tài)相關(guān)的事件條件和時(shí)滯條件。駐留時(shí)間的引入強(qiáng)制系統(tǒng)進(jìn)入驅(qū)動(dòng)條件無(wú)響應(yīng)階段,有效地抑制了控制動(dòng)作的頻繁發(fā)生。
切換型事件驅(qū)動(dòng)控制機(jī)制包括兩個(gè)或者多個(gè)事件驅(qū)動(dòng)條件和相應(yīng)的切換條件,任意時(shí)間均有一個(gè)事件驅(qū)動(dòng)條件有效,當(dāng)當(dāng)前事件驅(qū)動(dòng)條件滿足時(shí)觸發(fā)系統(tǒng)控制,當(dāng)其切換條件滿足時(shí),切換到下一個(gè)事件驅(qū)動(dòng)條件。
雙檢/多檢事件驅(qū)動(dòng)控制機(jī)制包括兩個(gè)或者多個(gè)事件驅(qū)動(dòng)條件,事件驅(qū)動(dòng)條件順序循環(huán)判斷,當(dāng)所有條件順序滿足后觸發(fā)系統(tǒng)控制,再?gòu)漠?dāng)前條件開始順序循環(huán)判斷,周而復(fù)始。
2.2穩(wěn)定性與魯棒性分析方法
為應(yīng)對(duì)由復(fù)雜邏輯驅(qū)動(dòng)控制引發(fā)的動(dòng)態(tài)復(fù)雜性和系統(tǒng)異步性,我們引入了時(shí)間平移方法、正向級(jí)數(shù)方法和積分條件方法。
時(shí)間平移方法:一種系統(tǒng)分析預(yù)處理方法。在適用的系統(tǒng)中,所有子系統(tǒng)關(guān)鍵控制事件相關(guān)的時(shí)間點(diǎn)屬于某個(gè)具有周期特征的時(shí)間集,且所有子系統(tǒng)具有共同的周期。該方法通過對(duì)不同子系統(tǒng)分別進(jìn)行時(shí)間平移變換,使得所有子系統(tǒng)虛擬同步,為后續(xù)分析奠定基礎(chǔ)。此方法可以將異步系統(tǒng)轉(zhuǎn)換成時(shí)滯系統(tǒng),是分析異步和時(shí)滯關(guān)系的重要方法。
正向級(jí)數(shù)方法:一種系統(tǒng)穩(wěn)定性和魯棒性分析方法,此方法適用于一般的異步系統(tǒng)。基于多步狀態(tài)轉(zhuǎn)移公式,得到所應(yīng)用Lyapunov函數(shù)的級(jí)數(shù)形式的上界估計(jì),進(jìn)而根據(jù)Lyapunov函數(shù)的正定性和正向級(jí)數(shù)收斂性判別法進(jìn)行系統(tǒng)分析。
積分條件方法:該方法通過建立誤差信號(hào)的積分形式的相對(duì)上界,衡量系統(tǒng)擾動(dòng)與控制輸出之間的能量關(guān)系。該方法對(duì)擾動(dòng)、網(wǎng)絡(luò)攻擊下系統(tǒng)魯棒性進(jìn)行理論判定,提供明確的穩(wěn)定性判據(jù)。
三、網(wǎng)絡(luò)攻擊下微電網(wǎng)的安全與協(xié)同控制
針對(duì)網(wǎng)絡(luò)攻擊下的微電網(wǎng)安全與協(xié)同控制問題,我們分別研究了單總線直流微電網(wǎng)和多總線直流微電網(wǎng)群應(yīng)用場(chǎng)景,探討了多種網(wǎng)絡(luò)攻擊下的分布式控制方法。
3.1單總線直流微電網(wǎng)
分布式直流微電網(wǎng)的應(yīng)用愈發(fā)普遍,典型結(jié)構(gòu)如圖7所示。由于下垂控制的應(yīng)用,電壓恢復(fù)和電流共享無(wú)法同時(shí)保證。我們針對(duì)二級(jí)控制層提出了一種新的自適應(yīng)安全控制策略,并采用事件觸發(fā)機(jī)制來(lái)減輕通信負(fù)擔(dān)。在消除總線電壓偏差的同時(shí),保證了分布式發(fā)電單元的電流共享。即使在能量受限型DoS攻擊下,控制目標(biāo)也可以很好地實(shí)現(xiàn)。此外,控制器和驅(qū)動(dòng)機(jī)制的設(shè)計(jì)無(wú)需總線電壓采樣和任何全局信息。
圖7 孤島直流微電網(wǎng)
3.2 多總線直流微電網(wǎng)群
電壓調(diào)節(jié)和精確的電流共享兩個(gè)控制目標(biāo)在多總線直流微電網(wǎng)中是沖突的。為此,我們提出了一種分布式控制策略,它可以實(shí)現(xiàn)精確的電流共享并按比例調(diào)節(jié)關(guān)鍵節(jié)點(diǎn)的電壓。但是,這種分布式控制系統(tǒng)容易受到潛在的網(wǎng)絡(luò)攻擊。網(wǎng)絡(luò)攻擊可通過破壞通信鏈路降低微電網(wǎng)的性能。為了克服這些問題,我們?cè)O(shè)計(jì)了互聯(lián)通信網(wǎng)絡(luò),建立了一類針對(duì)未知有界FDI攻擊的多個(gè)微電網(wǎng)組成的彈性協(xié)同系統(tǒng),如圖8所示。所提出的彈性控制策略可以實(shí)現(xiàn)不同工況下每個(gè)微電網(wǎng)內(nèi)電壓調(diào)節(jié)和電流共享的控制目標(biāo),以及由多個(gè)微電網(wǎng)組成的互聯(lián)系統(tǒng)協(xié)作抵御網(wǎng)絡(luò)攻擊的不利影響。
圖8微電網(wǎng)群的互聯(lián)協(xié)作系統(tǒng)
四、非合作博弈與優(yōu)化
在分布式能源系統(tǒng)中,發(fā)電單元、儲(chǔ)能單元以及用戶側(cè)負(fù)荷可通過各自的成本函數(shù)與收益函數(shù)進(jìn)行策略博弈,從而在合作與競(jìng)爭(zhēng)之間尋求平衡。合作模式下可構(gòu)建全系統(tǒng)優(yōu)化模型,通過集中式或分布式策略求解實(shí)現(xiàn)資源的全局最優(yōu)配置;而在競(jìng)爭(zhēng)環(huán)境下,博弈論提供了靈活的建模手段,其與多智能體系統(tǒng)有相似的模型框架,如圖9所示。
圖9智能體系統(tǒng)與博弈模型
博弈論研究多個(gè)理性決策者之間的合作與沖突。如果參與者除了自利驅(qū)動(dòng)的行為之外沒有合作協(xié)議,則被稱為非合作博弈。在復(fù)雜的能源管理系統(tǒng)中,非合作博弈是一種用于建模源、儲(chǔ)、荷等相互作用的重要工具。典型的非合作博弈類型包括聚合博弈、聯(lián)盟博弈、零和博弈等。
非合作博弈的一個(gè)重要概念是納什均衡。該概念刻畫了一種系統(tǒng)平衡點(diǎn):在所有參與者策略固定的情況下,任何單個(gè)參與者都無(wú)法通過單方面調(diào)整自身策略來(lái)進(jìn)一步降低代價(jià)或提高收益。納什均衡是參與者基于其他參與者策略選擇的最優(yōu)策略,但并不意味著是全局最優(yōu)策略組合,這一性質(zhì)使其成為非合作博弈求解中的核心目標(biāo)。
為確保納什均衡的存在性與唯一性,系統(tǒng)模型通常需滿足幾個(gè)關(guān)鍵假設(shè):其一,分布式系統(tǒng)的通信圖需要保持連通性;其二,每個(gè)參與者的成本函數(shù)需具備凸性,策略約束集也需為凸集;其三,博弈映射應(yīng)滿足強(qiáng)單調(diào)性條件。在滿足上述假設(shè)條件下,博弈系統(tǒng)的納什均衡具有良好的可求解性,并可通過分布式算法逐步逼近。
博弈問題往往不僅包含靜態(tài)/時(shí)變成本函數(shù),還受到系統(tǒng)動(dòng)態(tài)與時(shí)變策略集的共同約束。特別是在能源系統(tǒng)中,參與者的控制變量受制于一系列耦合約束,如可調(diào)功率、儲(chǔ)能容量與節(jié)點(diǎn)電壓范圍等。若某一參與者的可行策略集合本身受到其他參與者策略的影響,即構(gòu)成了廣義納什均衡問題。因策略空間耦合性,問題求解更為復(fù)雜,特別是在博弈代價(jià)無(wú)法即時(shí)反饋或完全不可觀測(cè)的情況下,需要額外的機(jī)制設(shè)計(jì)與反饋結(jié)構(gòu)加以處理。
挑戰(zhàn)性問題:圍繞上述應(yīng)用背景,我們的研究聚焦于以下四類關(guān)鍵問題:(1)分布式納什均衡搜索,主要針對(duì)線性動(dòng)態(tài)系統(tǒng)聚合博弈的非完全信息情況,構(gòu)建具有快速收斂性的估計(jì)機(jī)制,識(shí)別聚合變量并實(shí)現(xiàn)均衡逼近;(2)分布式廣義納什均衡搜索,在可行策略集耦合約束下引入反饋與協(xié)同機(jī)制,實(shí)現(xiàn)全系統(tǒng)自適應(yīng)協(xié)調(diào);(3)事件驅(qū)動(dòng)下的聚合優(yōu)化問題,通過引入事件驅(qū)動(dòng)機(jī)制減少通信負(fù)擔(dān),提高系統(tǒng)整體性能;(4)反饋時(shí)滯聚合博弈中的在線分布式學(xué)習(xí),在動(dòng)態(tài)環(huán)境中持續(xù)調(diào)整個(gè)體策略,以提高系統(tǒng)的魯棒性與實(shí)時(shí)性。
為應(yīng)對(duì)系統(tǒng)中不可直接觀測(cè)或不可知的策略信息,我們引入一致性估計(jì)協(xié)議。該協(xié)議通過構(gòu)建輔助變量,實(shí)現(xiàn)對(duì)系統(tǒng)關(guān)鍵信息的一致性估計(jì)。這種方法使得個(gè)體在不完全信息條件下依然能夠協(xié)同實(shí)現(xiàn)搜索策略的收斂。
廣義納什均衡搜索:該問題涉及聚合博弈中的參與者的動(dòng)態(tài)性與策略約束結(jié)構(gòu),其中某些系統(tǒng)動(dòng)態(tài)可等效表示為雙積分模型??紤]了等式與不等式混合約束條件、異構(gòu)線性系統(tǒng)等多種情況。針對(duì)一類成本函數(shù)未知的受約束非合作博弈,提出了一種基于分布式非模型的廣義納什均衡搜索算法。該算法融合了極值搜索控制和拉格朗日乘子協(xié)同算法,并引入了遞減抖動(dòng)信號(hào),以消除經(jīng)典極值搜索中出現(xiàn)的不良穩(wěn)態(tài)振蕩。
分布式連續(xù)時(shí)間聚合優(yōu)化:該問題是基于價(jià)格的能源管理中的一個(gè)基本問題。分布式聚合優(yōu)化的目標(biāo)是最小化局部目標(biāo)函數(shù)之和,該函數(shù)的表達(dá)式依賴于參與者自身決策和所有參與者決策的聚合。為了解決這個(gè)問題,我們提出了一種新的分布式連續(xù)時(shí)間算法,該算法結(jié)合了梯度動(dòng)力學(xué)和雙時(shí)間尺度的動(dòng)態(tài)平均一致性估計(jì)器。同時(shí),還研究了該算法在事件驅(qū)動(dòng)通信下的應(yīng)用。
聚合博弈中的分布式在線學(xué)習(xí):提出了一個(gè)具有反饋延遲的新型聚合博弈模型。博弈參與者的策略從給定的策略集中選擇,并受到全局非線性不等式約束。成本函數(shù)和約束函數(shù)都是時(shí)變的,這反映了環(huán)境的變化特性。在任何時(shí)候,每個(gè)參與者只能獲取其策略集的信息,而其當(dāng)前成本和約束信息是未知的。由于反饋延遲,相應(yīng)的成本和約束的反饋信息在策略選擇后不會(huì)立即透露給參與者。針對(duì)此類聚合博弈問題,我們提出了一種分布式學(xué)習(xí)算法。該算法基于來(lái)自鄰居的局部信息和來(lái)自環(huán)境的延遲反饋信息,適用于時(shí)變加權(quán)有向網(wǎng)絡(luò)拓?fù)洹?/span>
*本文根據(jù)作者所作報(bào)告速記整理而成
嘉賓簡(jiǎn)介:
肖峰,教授,博士生導(dǎo)師,教育部新世紀(jì)優(yōu)秀人才,國(guó)家優(yōu)秀青年科學(xué)基金獲得者,2012年入選哈爾濱工業(yè)大學(xué)人才引進(jìn)“百人計(jì)劃”第三層次,2016年聘為哈爾濱工業(yè)大學(xué)長(zhǎng)聘教授。主持科學(xué)技術(shù)部、自然科學(xué)基金委、教育部、人力資源和社會(huì)保障部、北京市自然科學(xué)基金委等多項(xiàng)國(guó)家和省部級(jí)項(xiàng)目,獲得2014年和2017年兩項(xiàng)國(guó)家自然科學(xué)獎(jiǎng)二等獎(jiǎng);獲得2014年和2016年兩項(xiàng)教育部自然科學(xué)獎(jiǎng)一等獎(jiǎng);獲得加拿大Killam Trusts Killam博士后獎(jiǎng)和首屆《中國(guó)科學(xué):信息科學(xué)》十年經(jīng)典論文獎(jiǎng);入選2020年-2024年愛思唯爾中國(guó)高被引學(xué)者。
研究方向包括:協(xié)同控制與優(yōu)化決策、智能電網(wǎng)、電力系統(tǒng)建模與仿真等。