融合注意力機(jī)制輕量級網(wǎng)絡(luò)的語聲情感識別
應(yīng)用聲學(xué)
頁數(shù): 8 2023-10-16
摘要: 在語聲情感識別過程中,為解決缺乏方言數(shù)據(jù)庫、識別模型準(zhǔn)確率低等問題,建立遼西方言語聲情感數(shù)據(jù)庫,并提出一種融合注意力機(jī)制輕量級網(wǎng)絡(luò)的語聲情感識別模型。模型由特征組合網(wǎng)絡(luò)、CBAM注意力機(jī)制、深度卷積網(wǎng)絡(luò)及輸出層四部分組成。利用3個大小不同的并行卷積提取淺層語聲特征并進(jìn)行拼接;引入CBAM注意力模塊將空間特征與通道特征融合;融合后的特征輸入深度卷積網(wǎng)絡(luò),提取語聲深層次特征,輸出多...