基于近端策略優(yōu)化的智能抗干擾決策算法
通信學(xué)報(bào)
頁數(shù): 9 2024-08-20
摘要: 針對現(xiàn)有基于深度強(qiáng)化學(xué)習(xí)的智能抗干擾方法應(yīng)用于天地測控通信鏈路時(shí),用于決策的深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜,衛(wèi)星等飛行器資源受限,難以在有限的復(fù)雜度約束下獨(dú)立完成復(fù)雜神經(jīng)網(wǎng)絡(luò)的及時(shí)訓(xùn)練,抗干擾決策無法收斂的問題,提出了一種基于近端策略優(yōu)化的智能抗干擾決策算法。分別在飛行器和地面站部署決策神經(jīng)網(wǎng)絡(luò)和訓(xùn)練神經(jīng)網(wǎng)絡(luò),地面站根據(jù)飛行器反饋的經(jīng)驗(yàn)信息進(jìn)行最優(yōu)化離線訓(xùn)練,輔助決策神經(jīng)網(wǎng)絡(luò)進(jìn)行參數(shù)更新...