基于靜態(tài)博弈和遺傳算法的多智能體博弈策略生成方法
摘 要:在多智能體協(xié)同對(duì)抗策略生成的過(guò)程中,獎(jiǎng)勵(lì)稀疏和神經(jīng)網(wǎng)絡(luò)參數(shù)多易導(dǎo)致策略生成速度慢。針對(duì)特定場(chǎng)景如何快速產(chǎn)生對(duì)抗策略這一問(wèn)題,提出了一種基于靜態(tài)博弈和遺傳算法的多智能體博弈策略生成方法?;陟o態(tài)博弈理念,對(duì)馬爾科夫決策過(guò)程演化,將策略映射為一串動(dòng)作組成,簡(jiǎn)化策略映射原理;對(duì)策略?xún)?yōu)化問(wèn)題數(shù)學(xué)建模。(剩余9046字)
-
-
- 無(wú)線(xiàn)電工程
- 2024年06期
目錄
- 于人工智能的決策技術(shù)導(dǎo)讀...
- 基于深度學(xué)習(xí)的通信輻射源識(shí)別綜...
- 強(qiáng)化學(xué)習(xí)在協(xié)作頻譜感知中的應(yīng)用...
- 基于靜態(tài)博弈和遺傳算法的多智能...
- 基于分層強(qiáng)化學(xué)習(xí)的多智能體博弈...
- LEO衛(wèi)星網(wǎng)絡(luò)切換判決方法研究...
- 基于深度強(qiáng)化學(xué)習(xí)的電力物聯(lián)網(wǎng)動(dòng)...
- 基于多智能體深度強(qiáng)化學(xué)習(xí)的車(chē)聯(lián)...
- 數(shù)字信號(hào)調(diào)制識(shí)別下坐標(biāo)注意力機(jī)...
- 數(shù)據(jù)驅(qū)動(dòng)的無(wú)人機(jī)異常檢測(cè)算法綜...
- 基于YOLOv5算法的無(wú)人機(jī)巡...
- 基于DMSANet-YOLOv...
- 基于CNN-BiLSTM混合神...
- PSOS-YOLOv5s:一種...
- 基于改進(jìn)YOLVv5的城市火災(zāi)...
- 面向通信SNR增強(qiáng)的RIS三維...
- 基于顏色校正與改進(jìn)的CLAHE...
- 一種面向區(qū)域尺度的DMSP/O...
- 擴(kuò)展卡爾曼濾波的改進(jìn)蛇定位算法...
- 基于狀態(tài)可觀(guān)測(cè)性和多模態(tài)數(shù)據(jù)P...
- 可重構(gòu)智能表面輔助的毫米波無(wú)線(xiàn)...
- 面向2G~ 5G通信的雙頻雙極...
- 基于改進(jìn)鯨魚(yú)優(yōu)化算法的永磁同步...
- 基于紅外測(cè)溫技術(shù)的電能表電流采...
- IoT-MEC網(wǎng)絡(luò)中服務(wù)功能鏈...
- 高通量衛(wèi)星隨機(jī)接入控制技術(shù)研究...
- 無(wú)人機(jī)輸電線(xiàn)路巡檢照片號(hào)牌文字...
- 口岸城市末端無(wú)人機(jī)精準(zhǔn)配送與投...
- 基于虛擬成像原理的組合相機(jī)視場(chǎng)...
- 變電站多尺度異常入侵目標(biāo)輕量化...