基于集成深度強化學習的自動駕駛車輛行為決策模型
汽車安全與節(jié)能學報
頁數(shù): 8 2023-08-15
摘要: 提出一種基于集成的深度強化學習的自動駕駛車輛的行為決策模型?;贛arkov決策過程(MDP)理論,采用標準投票法,將深度Q學習網(wǎng)絡(luò)(DQN)、雙DQN (DDQN)和競爭雙DDQN (Dueling DDQN)等3種基礎(chǔ)網(wǎng)絡(luò)模型集成。在高速公路仿真環(huán)境、在單向3車道、4車道、5車道數(shù)量場景下,對向左換道、車道保持、向右換道、同車道加速和減速等5種車輛駕駛行為,進行測試和泛化性...