基于分布式強(qiáng)化學(xué)習(xí)的車(chē)輛控制算法研究
汽車(chē)工程
頁(yè)數(shù): 9 2023-09-25
摘要: 端到端自動(dòng)駕駛算法的開(kāi)發(fā)現(xiàn)已成為當(dāng)前自動(dòng)駕駛技術(shù)研發(fā)的熱點(diǎn)。經(jīng)典的強(qiáng)化學(xué)習(xí)算法利用車(chē)輛狀態(tài)、環(huán)境反饋等信息訓(xùn)練車(chē)輛行駛,通過(guò)試錯(cuò)學(xué)習(xí)獲得最佳策略,實(shí)現(xiàn)了端到端的自動(dòng)駕駛算法開(kāi)發(fā),但仍存在開(kāi)發(fā)效率低下的問(wèn)題。為解決虛擬仿真環(huán)境下訓(xùn)練強(qiáng)化學(xué)習(xí)算法的低效性和高復(fù)雜度問(wèn)題,本文提出了一種異步分布式強(qiáng)化學(xué)習(xí)框架,并建立了進(jìn)程間和進(jìn)程內(nèi)的多智能體并行柔性動(dòng)作-評(píng)價(jià)(soft actor-c...