基于改進(jìn)型DDPG的單用戶任務(wù)遷移優(yōu)化
計(jì)算機(jī)工程與設(shè)計(jì)
頁數(shù): 8 2023-11-16
摘要: 針對(duì)傳統(tǒng)強(qiáng)化學(xué)習(xí)算法在具有隨機(jī)任務(wù)到達(dá)和時(shí)變無線信道的邊緣服務(wù)器上最小化計(jì)算成本存在收斂速度慢、收斂不穩(wěn)定等問題,提出一種改進(jìn)型DDPG算法(IDDPG)。將DDPG的Critic網(wǎng)絡(luò)結(jié)構(gòu)替換為Dueling結(jié)構(gòu),通過將狀態(tài)價(jià)值函數(shù)拆分為優(yōu)勢函數(shù)和價(jià)值函數(shù),使其收斂更快;將Critic網(wǎng)絡(luò)的更新頻率調(diào)整為高于Actor網(wǎng)絡(luò)的更新頻率,使整體訓(xùn)練更加穩(wěn)定;在Actor網(wǎng)絡(luò)選出來的...