基于DE-MADDPG多智能體強化學習機械臂裝配
組合機床與自動化加工技術(shù)
頁數(shù): 6 2023-12-20
摘要: 為了提高機械臂在復雜裝配任務中智能程度,提出了一種基于深度強化學習的多智能體裝配策略。以六自由度機械臂Pieper準則構(gòu)型為基礎(chǔ),將末端的位置和姿態(tài)分開獨立控制,應用解耦多智能體深度確定性策略梯度算法(DE-MADDPG),依據(jù)其不同的結(jié)構(gòu)裝配特性設(shè)計了全局獎勵函數(shù)和局部獎勵函數(shù),并在Gezebo仿真平臺上進行了圓孔和方孔裝配的仿真實驗,同時對DDPG算法和MADDPG算法進行...