基于規(guī)則約束的深度強化學(xué)習(xí)智能車輛高速路場景下行駛決策
汽車技術(shù)
頁數(shù): 9 2023-04-10
摘要: 針對強化學(xué)習(xí)算法下智能車輛訓(xùn)練中動作選擇過程隨機性強、訓(xùn)練效率低等問題,提出了基于規(guī)則約束和深度Q網(wǎng)絡(luò)(DQN)算法的智能車輛行駛決策框架,將引入的規(guī)則分為與換道相關(guān)的硬約束和與車道保持相關(guān)的軟約束,分別通過動作檢測模塊(Action Detection Module)與獎勵函數(shù)來實現(xiàn)。同時結(jié)合競爭深度Q網(wǎng)絡(luò)(Dueling DQN)和雙重深度Q網(wǎng)絡(luò)(Double DQN)對D...