改進(jìn)深度神經(jīng)網(wǎng)絡(luò)在愛恩斯坦棋中的應(yīng)用研究
重慶理工大學(xué)學(xué)報(bào)(自然科學(xué))
頁數(shù): 7 2024-05-15
摘要: 愛恩斯坦棋作為一種附帶隨機(jī)性的完美信息博弈,其難度在于每次投擲骰子導(dǎo)致的結(jié)果不確定性,這增加了策略設(shè)計(jì)和局面的評(píng)估難度。針對(duì)愛恩斯坦棋的游戲規(guī)則,提出了一種改進(jìn)的深度學(xué)習(xí)方法。對(duì)Alpha(go) Zero神經(jīng)網(wǎng)絡(luò)模型進(jìn)行改進(jìn)和設(shè)計(jì),使其能精確地評(píng)估各種棋盤狀態(tài),生成有效的游戲策略。通過結(jié)合改進(jìn)的殘差神經(jīng)網(wǎng)絡(luò)和蒙特卡洛樹搜索,提取棋局特征并進(jìn)行局面評(píng)估,動(dòng)態(tài)生成策略和進(jìn)行決策。...