逆強化學習算法、理論與應(yīng)用研究綜述
自動化學報
頁數(shù): 20 2024-03-21
摘要: 隨著高維特征表示與逼近能力的提高,強化學習(Reinforcement learning, RL)在博弈與優(yōu)化決策、智能駕駛等現(xiàn)實問題中的應(yīng)用也取得顯著進展.然而強化學習在智能體與環(huán)境的交互中存在人工設(shè)計獎勵函數(shù)難的問題,因此研究者提出了逆強化學習(Inverse reinforcement learning, IRL)這一研究方向.如何從專家演示中學習獎勵函數(shù)和進行策略優(yōu)化是... (共20頁)