當(dāng)前位置:首頁 > 科技文檔 > 電信技術(shù) > 正文

針對口音識別中冗余特征及長尾效應(yīng)的有效方法

應(yīng)用聲學(xué) 頁數(shù): 7 2024-02-27
摘要: 口音識別是指在同一語種下識別不同的區(qū)域口音的過程。為了提高口音識別的準(zhǔn)確率,采用了多種方法,取得了明顯的效果。首先,為了解決聲學(xué)特征中關(guān)鍵特征權(quán)重不突出的問題,引入了有效的注意力機(jī)制,并對多種注意力機(jī)制進(jìn)行了比較和分析。通過模型自適應(yīng)學(xué)習(xí)通道和空間維度的不同權(quán)重,提高了口音識別的性能。在Common Voice英語口音數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,引入CBAM注意力模塊是有效的,識別...

開通會員,享受整站包年服務(wù)立即開通 >
科技文檔